هر آن چه که باید در مورد مدل هوش مصنوعی Cloud Opus 4 و شش دهم بدانید به گزارش مین فود، شرکت Anthropic مدل هوش مصنوعی Cloud Opus 4.6 را با عملکرد تعاملی بهبود یافته عرضه می کند. باشگاه خبرنگاران جوان؛ جواد فراهانی - شرکت Anthropic مدل هوش مصنوعی جدید خود، Cloud Opus 4.6، را که بروزرسانی بزرگی برای مدل اصلی Opus 4 آن است، عرضه نموده است. این مدل جدید با بهبود عملکرد پایدار در وظایف پیچیده، بخصوص در مهندسی نرم افزار و زمینه های شناختی فشرده، محدودیت های کلیدی نسخه قبلی را رفع می کند. در حالیکه Cloud Opus 4.5 قادر به انجام وظایف استدلال پیشرفته بود، اغلب با زمینه های بلند مدت و حالت های مرزی در پایگاه های داده بزرگ مشکل داشت. نسخه بتای Opus 4.6 این مشکل را با یک پنجره زمینه تا یک میلیون توکن حل می کند. Claude Opus 4.6: پشتیبانی گسترده از زمینه و خاصیت های جدید شرکت Anthropic آخرین نسخه مدل خویش را در یک پست وبلاگی اعلام نمود و توضیح داد که برای نخستین بار در سری Opus، نسخه بتا از یک پنجره زمینه تا یک میلیون کاراکتر پشتیبانی می کند. این امر امکان پردازش حجم عظیمی از اطلاعات را فراهم می آورد و با این وجود، افت عملکرد را در طول تعاملات طولانی به حداقل می رساند، که پیشرفت قابل توجهی نسبت به محدودیت ۲۰۰۰۰۰ کاراکتری در مدلهای قبلی است. Clude Opus 4.6 همین طور شامل خاصیت های جدیدی مانند فشرده سازی متن است که داده های قدیمی تر را در طول وظایف طولانی خلاصه و بروزرسانی می کند. این مدل شامل استدلال تطبیقی است که پیچیدگی پرس وجو را ارزیابی می نماید تا در صورت نیاز، قدرت پردازش بیشتری را بهمراه کنترل های کم بهره تا پربهره وری برای بهینه سازی سرعت، هوش و مقرون بصرفه بودن اختصاص دهد. پیشی گرفتن از معیار ها و نسخه های قبلی طبق ارزیابی های داخلی شرکت، Claude Opus 4.6 در آزمون های گوناگون به امتیازات رکوردشکنی دست یافته است. این مدل در Terminal-Bench 2.0 برای مهارت های خط فرمان و در Humanity’s Last Exam برای استدلال بین رشته ای، از مدلهای پیشرو پیشی گرفت. در ارزیابی های تعاملی مانند GDPval-AA، با محوریت وظایف مالی و حقوقی، GPT-5.2 از OpenAI را با تقریبا ۱۴۴ امتیاز Elo و Opus 4.5 را با تقریبا ۱۹۰ امتیاز بهتر کرد. علاوه بر این، نمرات SWE-bench Verified آن با برنامه نویسی بهبود یافته بطور میانگین ۸۱.۴۲٪ بود، در حالیکه آزمایش های CyberGym عملکرد قوی در اصول اولیه را نشان دادند. خاصیت های امنیتی و حفاظتی پیشرفته Anthropic تاکید کرد که ایمنی و امنیت بازهم اولویت اصلی مدل جدید است. این شرکت تصریح کرد که این مدل در بررسی های امنیتی با رقبای خود برابری می کند یا از آنها پیشی می گیرد، با نرخ پایین جعل یا چاپلوسی و کمترین تمایل به رد بیش از اندازه در میان نسخه های اخیر. این شرکت شش آزمایش امنیت سایبری جدید را برای شناسایی سوءاستفاده های احتمالی و تسریع برنامه های دفاعی مانند اسکن لطمه پذیری در کد منبع باز افزوده است. قابلیت های برنامه نویسی و تجاری پیشرفته در برنامه نویسی، Opus 4.6 به صورت مستقل مخازن بزرگ را مدیریت می کند، بررسی ها و اشکال زدایی کد با دقت بالا را انجام می دهد و تیم های توسعه موازی را از راه Cloud Code بوجود می آورد. در گردش های کاری تجاری، تحلیل و بررسی مالی را انجام می دهد، مستندات تولید می کند و جستجوی چند مرحله ای را در ابزار هایی مانند Cloud در Excel انجام می دهد که حال برای داده های بدون ساختار و وظایف طولانی بروزرسانی شده است. نسخه جستجوی Cloud در PowerPoint این توانایی ها را به ارائه ها گسترش می دهد. در زمینه هایی مانند زیست شناسی محاسباتی، این نسخه تقریبا دو برابر عملکرد Opus 4.5 را ارائه می کند و از اکتشافات علمی پشتیبانی می کند. دسترسی و قیمت گذاری Clude Opus 4.6 حال از راه وبسایت، برنامه های موبایل و دسکتاپ، API شرکت Anthropic و ارایه دهندگان اصلی فضای ابری در دسترس می باشد. قیمت این API برای هر میلیون توکن ورودی ۵ دلار و برای هر میلیون توکن خروجی ۲۵ دلار است و برای زمینه های گسترده تر هزینه های اضافی نیز دریافت می شود. منبع: الیوم السابع خلاصه اینکه نسخه بتای Opus 4.6 این مشکل را با یک پنجره زمینه تا یک میلیون توکن حل می کند. Claude Opus 4.6: پشتیبانی گسترده از زمینه و خاصیت های جدید شرکت Anthropic آخرین نسخه مدل خود را در یک پست وبلاگی اظهار داشت و توضیح داد که برای اولین بار در سری Opus، نسخه بتا از یک پنجره زمینه تا یک میلیون کاراکتر پشتیبانی می کند. این مدل در Terminal-Bench 2.0 برای مهارت های خط فرمان و در Humanity’s Last Exam برای استدلال بین رشته ای، از مدل های پیشرو پیشی گرفت. این شرکت خاطرنشان کرد که این مدل در بررسی های امنیتی با رقبای خود برابری می کند یا از آنها پیشی می گیرد، با نرخ پایین جعل یا چاپلوسی و کمترین تمایل به رد بیش از حد در بین نسخه های اخیر. منبع: minfood.ir 1404/11/20 09:53:26 5.0 از 5 100 تگهای خبر: ارزیابی , ایمنی , برنامه , پیشرفت این مطلب مین فود مفید بود؟ (1) (0) تازه ترین مطالب مرتبط آن چه باید درباره ی رفلاکس معده بدانیم ارزیابی حلال مکمل ها فقط محدود به ماده مؤثره نیست تأکید شورای عالی آموزش و پرورش بر جبران عقب ماندگی های آموزشی و تربیتی دانش آموزان تغذیه نوزادان با تخم مرغ می تواند خطر آلرژی را کم کند نظرات بینندگان در مورد این مطلب نظر شما در مورد این مطلب نام: ایمیل: نظر: سوال: = ۳ بعلاوه ۳ دوستان مین فود انتخابات مجلس ، کاندیدای مجلس خرید و فروش خودرو طراحی سایت فیش حج قیمت بیسیم پربیننده ترین ها مهلت مجدد ثبت نام آزمون های سمپاد و نمونه دولتی تا ۲۱ اردیبهشت ادامه دارد قیمت دلار و یورو مرکز مبادله ایران امروز پنجشنبه ۷ خرداد ۱۴۰۵ دستورالعمل جدید نرخ های مصوب مکمل و شیرخشک ابلاغ گردید نوسان دمای بدن تهدیدی جدی برای ارگان های حیاتی پربحث ترین ها آغاز نام نویسی کتاب های پایه های ورودی از امروز آن چه باید درباره ی رفلاکس معده بدانیم ارزیابی حلال مکمل ها فقط محدود به ماده مؤثره نیست تأکید شورای عالی آموزش و پرورش بر جبران عقب ماندگی های آموزشی و تربیتی دانش آموزان جدیدترین ها آغاز نام نویسی کتاب های پایه های ورودی از امروز آن چه باید درباره ی رفلاکس معده بدانیم ارزیابی حلال مکمل ها فقط محدود به ماده مؤثره نیست تأکید شورای عالی آموزش و پرورش بر جبران عقب ماندگی های آموزشی و تربیتی دانش آموزان هوش مصنوعی در علوم انسانی با دوره های کوتاه مدت شروع می شود دلایل نابینایی چیست؟ به علاوه فیلم ویتامین C کلید سلامت مغز در دوران پیری تغذیه نوزادان با تخم مرغ می تواند خطر آلرژی را کم کند صدور الکترونیک پروانه های غذایی شرایط نگهداری شیرخشک در انبارهای دارویی ابلاغ گردید تگها بیمار بهداشت بیماری آب پزشك برنامه رپورتاژ ایمنی