هر آن چه که باید در مورد مدل هوش مصنوعی Cloud Opus 4 و شش دهم بدانید

به گزارش مین فود، شرکت Anthropic مدل هوش مصنوعی Cloud Opus 4.6 را با عملکرد تعاملی بهبود یافته عرضه می کند.

هر آن چه که باید در مورد مدل هوش مصنوعی Cloud Opus 4 و شش دهم بدانید
باشگاه خبرنگاران جوان؛ جواد فراهانی - شرکت Anthropic مدل هوش مصنوعی جدید خود، Cloud Opus 4.6، را که بروزرسانی بزرگی برای مدل اصلی Opus 4 آن است، عرضه نموده است. این مدل جدید با بهبود عملکرد پایدار در وظایف پیچیده، بخصوص در مهندسی نرم افزار و زمینه های شناختی فشرده، محدودیت های کلیدی نسخه قبلی را رفع می کند.
در حالیکه Cloud Opus 4.5 قادر به انجام وظایف استدلال پیشرفته بود، اغلب با زمینه های بلند مدت و حالت های مرزی در پایگاه های داده بزرگ مشکل داشت. نسخه بتای Opus 4.6 این مشکل را با یک پنجره زمینه تا یک میلیون توکن حل می کند.

Claude Opus 4.6: پشتیبانی گسترده از زمینه و خاصیت های جدید

شرکت Anthropic آخرین نسخه مدل خویش را در یک پست وبلاگی اعلام نمود و توضیح داد که برای نخستین بار در سری Opus، نسخه بتا از یک پنجره زمینه تا یک میلیون کاراکتر پشتیبانی می کند. این امر امکان پردازش حجم عظیمی از اطلاعات را فراهم می آورد و با این وجود، افت عملکرد را در طول تعاملات طولانی به حداقل می رساند، که پیشرفت قابل توجهی نسبت به محدودیت ۲۰۰۰۰۰ کاراکتری در مدلهای قبلی است.
Clude Opus 4.6 همین طور شامل خاصیت های جدیدی مانند فشرده سازی متن است که داده های قدیمی تر را در طول وظایف طولانی خلاصه و بروزرسانی می کند. این مدل شامل استدلال تطبیقی ​​است که پیچیدگی پرس وجو را ارزیابی می نماید تا در صورت نیاز، قدرت پردازش بیشتری را بهمراه کنترل های کم بهره تا پربهره وری برای بهینه سازی سرعت، هوش و مقرون بصرفه بودن اختصاص دهد.

پیشی گرفتن از معیار ها و نسخه های قبلی

طبق ارزیابی های داخلی شرکت، Claude Opus 4.6 در آزمون های گوناگون به امتیازات رکوردشکنی دست یافته است. این مدل در Terminal-Bench 2.0 برای مهارت های خط فرمان و در Humanity’s Last Exam برای استدلال بین رشته ای، از مدلهای پیشرو پیشی گرفت. در ارزیابی های تعاملی مانند GDPval-AA، با محوریت وظایف مالی و حقوقی، GPT-5.2 از OpenAI را با تقریبا ۱۴۴ امتیاز Elo و Opus 4.5 را با تقریبا ۱۹۰ امتیاز بهتر کرد.
علاوه بر این، نمرات SWE-bench Verified آن با برنامه نویسی بهبود یافته بطور میانگین ​​۸۱.۴۲٪ بود، در حالیکه آزمایش های CyberGym عملکرد قوی در اصول اولیه را نشان دادند.

خاصیت های امنیتی و حفاظتی پیشرفته

Anthropic تاکید کرد که ایمنی و امنیت بازهم اولویت اصلی مدل جدید است. این شرکت تصریح کرد که این مدل در بررسی های امنیتی با رقبای خود برابری می کند یا از آنها پیشی می گیرد، با نرخ پایین جعل یا چاپلوسی و کمترین تمایل به رد بیش از اندازه در میان نسخه های اخیر. این شرکت شش آزمایش امنیت سایبری جدید را برای شناسایی سوءاستفاده های احتمالی و تسریع برنامه های دفاعی مانند اسکن لطمه پذیری در کد منبع باز افزوده است.

قابلیت های برنامه نویسی و تجاری پیشرفته

در برنامه نویسی، Opus 4.6 به صورت مستقل مخازن بزرگ را مدیریت می کند، بررسی ها و اشکال زدایی کد با دقت بالا را انجام می دهد و تیم های توسعه موازی را از راه Cloud Code بوجود می آورد. در گردش های کاری تجاری، تحلیل و بررسی مالی را انجام می دهد، مستندات تولید می کند و جستجوی چند مرحله ای را در ابزار هایی مانند Cloud در Excel انجام می دهد که حال برای داده های بدون ساختار و وظایف طولانی بروزرسانی شده است. نسخه جستجوی Cloud در PowerPoint این توانایی ها را به ارائه ها گسترش می دهد. در زمینه هایی مانند زیست شناسی محاسباتی، این نسخه تقریبا دو برابر عملکرد Opus 4.5 را ارائه می کند و از اکتشافات علمی پشتیبانی می کند.

دسترسی و قیمت گذاری

Clude Opus 4.6 حال از راه وبسایت، برنامه های موبایل و دسکتاپ، API شرکت Anthropic و ارایه دهندگان اصلی فضای ابری در دسترس می باشد. قیمت این API برای هر میلیون توکن ورودی ۵ دلار و برای هر میلیون توکن خروجی ۲۵ دلار است و برای زمینه های گسترده تر هزینه های اضافی نیز دریافت می شود.
منبع: الیوم السابع
خلاصه اینکه نسخه بتای Opus 4.6 این مشکل را با یک پنجره زمینه تا یک میلیون توکن حل می کند.
Claude Opus 4.6: پشتیبانی گسترده از زمینه و خاصیت های جدید
شرکت Anthropic آخرین نسخه مدل خود را در یک پست وبلاگی اظهار داشت و توضیح داد که برای اولین بار در سری Opus، نسخه بتا از یک پنجره زمینه تا یک میلیون کاراکتر پشتیبانی می کند. این مدل در Terminal-Bench 2.0 برای مهارت های خط فرمان و در Humanity’s Last Exam برای استدلال بین رشته ای، از مدل های پیشرو پیشی گرفت. این شرکت خاطرنشان کرد که این مدل در بررسی های امنیتی با رقبای خود برابری می کند یا از آنها پیشی می گیرد، با نرخ پایین جعل یا چاپلوسی و کمترین تمایل به رد بیش از حد در بین نسخه های اخیر.

منبع:

1404/11/20
09:53:26
5.0 از 5
20
تگهای خبر: ارزیابی , ایمنی , برنامه , پیشرفت
این مطلب مین فود مفید بود؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
نظر شما در مورد این مطلب
نام:
ایمیل:
نظر:
سوال:
= ۲ بعلاوه ۳
جدیدترین ها

مین فود - رژیم غذایی minfood

اطلاعات



مین فود

مین فود یا غذای کمتر: رژیم غذایی
رژیم غذایی، تناسب اندام، دستورالعمل و نکات حفظ سلامتی و رژیم غذایی سالم همه در مین فود

تماس با ما

روشهای تماس با مین فود از طریق ایمیل، شبکه های اجتماعی است
minfood.ir - حقوق مادی و معنوی سایت مین فود محفوظ است