هر آن چه که باید در مورد مدل هوش مصنوعی Cloud Opus 4 و شش دهم بدانید به گزارش مین فود، شرکت Anthropic مدل هوش مصنوعی Cloud Opus 4.6 را با عملکرد تعاملی بهبود یافته عرضه می کند. باشگاه خبرنگاران جوان؛ جواد فراهانی - شرکت Anthropic مدل هوش مصنوعی جدید خود، Cloud Opus 4.6، را که بروزرسانی بزرگی برای مدل اصلی Opus 4 آن است، عرضه نموده است. این مدل جدید با بهبود عملکرد پایدار در وظایف پیچیده، بخصوص در مهندسی نرم افزار و زمینه های شناختی فشرده، محدودیت های کلیدی نسخه قبلی را رفع می کند. در حالیکه Cloud Opus 4.5 قادر به انجام وظایف استدلال پیشرفته بود، اغلب با زمینه های بلند مدت و حالت های مرزی در پایگاه های داده بزرگ مشکل داشت. نسخه بتای Opus 4.6 این مشکل را با یک پنجره زمینه تا یک میلیون توکن حل می کند. Claude Opus 4.6: پشتیبانی گسترده از زمینه و خاصیت های جدید شرکت Anthropic آخرین نسخه مدل خویش را در یک پست وبلاگی اعلام نمود و توضیح داد که برای نخستین بار در سری Opus، نسخه بتا از یک پنجره زمینه تا یک میلیون کاراکتر پشتیبانی می کند. این امر امکان پردازش حجم عظیمی از اطلاعات را فراهم می آورد و با این وجود، افت عملکرد را در طول تعاملات طولانی به حداقل می رساند، که پیشرفت قابل توجهی نسبت به محدودیت ۲۰۰۰۰۰ کاراکتری در مدلهای قبلی است. Clude Opus 4.6 همین طور شامل خاصیت های جدیدی مانند فشرده سازی متن است که داده های قدیمی تر را در طول وظایف طولانی خلاصه و بروزرسانی می کند. این مدل شامل استدلال تطبیقی است که پیچیدگی پرس وجو را ارزیابی می نماید تا در صورت نیاز، قدرت پردازش بیشتری را بهمراه کنترل های کم بهره تا پربهره وری برای بهینه سازی سرعت، هوش و مقرون بصرفه بودن اختصاص دهد. پیشی گرفتن از معیار ها و نسخه های قبلی طبق ارزیابی های داخلی شرکت، Claude Opus 4.6 در آزمون های گوناگون به امتیازات رکوردشکنی دست یافته است. این مدل در Terminal-Bench 2.0 برای مهارت های خط فرمان و در Humanity’s Last Exam برای استدلال بین رشته ای، از مدلهای پیشرو پیشی گرفت. در ارزیابی های تعاملی مانند GDPval-AA، با محوریت وظایف مالی و حقوقی، GPT-5.2 از OpenAI را با تقریبا ۱۴۴ امتیاز Elo و Opus 4.5 را با تقریبا ۱۹۰ امتیاز بهتر کرد. علاوه بر این، نمرات SWE-bench Verified آن با برنامه نویسی بهبود یافته بطور میانگین ۸۱.۴۲٪ بود، در حالیکه آزمایش های CyberGym عملکرد قوی در اصول اولیه را نشان دادند. خاصیت های امنیتی و حفاظتی پیشرفته Anthropic تاکید کرد که ایمنی و امنیت بازهم اولویت اصلی مدل جدید است. این شرکت تصریح کرد که این مدل در بررسی های امنیتی با رقبای خود برابری می کند یا از آنها پیشی می گیرد، با نرخ پایین جعل یا چاپلوسی و کمترین تمایل به رد بیش از اندازه در میان نسخه های اخیر. این شرکت شش آزمایش امنیت سایبری جدید را برای شناسایی سوءاستفاده های احتمالی و تسریع برنامه های دفاعی مانند اسکن لطمه پذیری در کد منبع باز افزوده است. قابلیت های برنامه نویسی و تجاری پیشرفته در برنامه نویسی، Opus 4.6 به صورت مستقل مخازن بزرگ را مدیریت می کند، بررسی ها و اشکال زدایی کد با دقت بالا را انجام می دهد و تیم های توسعه موازی را از راه Cloud Code بوجود می آورد. در گردش های کاری تجاری، تحلیل و بررسی مالی را انجام می دهد، مستندات تولید می کند و جستجوی چند مرحله ای را در ابزار هایی مانند Cloud در Excel انجام می دهد که حال برای داده های بدون ساختار و وظایف طولانی بروزرسانی شده است. نسخه جستجوی Cloud در PowerPoint این توانایی ها را به ارائه ها گسترش می دهد. در زمینه هایی مانند زیست شناسی محاسباتی، این نسخه تقریبا دو برابر عملکرد Opus 4.5 را ارائه می کند و از اکتشافات علمی پشتیبانی می کند. دسترسی و قیمت گذاری Clude Opus 4.6 حال از راه وبسایت، برنامه های موبایل و دسکتاپ، API شرکت Anthropic و ارایه دهندگان اصلی فضای ابری در دسترس می باشد. قیمت این API برای هر میلیون توکن ورودی ۵ دلار و برای هر میلیون توکن خروجی ۲۵ دلار است و برای زمینه های گسترده تر هزینه های اضافی نیز دریافت می شود. منبع: الیوم السابع خلاصه اینکه نسخه بتای Opus 4.6 این مشکل را با یک پنجره زمینه تا یک میلیون توکن حل می کند. Claude Opus 4.6: پشتیبانی گسترده از زمینه و خاصیت های جدید شرکت Anthropic آخرین نسخه مدل خود را در یک پست وبلاگی اظهار داشت و توضیح داد که برای اولین بار در سری Opus، نسخه بتا از یک پنجره زمینه تا یک میلیون کاراکتر پشتیبانی می کند. این مدل در Terminal-Bench 2.0 برای مهارت های خط فرمان و در Humanity’s Last Exam برای استدلال بین رشته ای، از مدل های پیشرو پیشی گرفت. این شرکت خاطرنشان کرد که این مدل در بررسی های امنیتی با رقبای خود برابری می کند یا از آنها پیشی می گیرد، با نرخ پایین جعل یا چاپلوسی و کمترین تمایل به رد بیش از حد در بین نسخه های اخیر. منبع: minfood.ir 1404/11/20 09:53:26 5.0 از 5 20 تگهای خبر: ارزیابی , ایمنی , برنامه , پیشرفت این مطلب مین فود مفید بود؟ (1) (0) تازه ترین مطالب مرتبط از بیکاری پزشکان تا گسترش ظرفیت دور باطل پرهزینه قیمت بیسیم و خدمات تعمیر بیسیم امروز آخرین مهلت دریافت کارت ورود به جلسه آزمون کارشناسی به پزشکی آیا مولتی ویتامین ها می توانند خطرناک باشند؟ نظرات بینندگان در مورد این مطلب نظر شما در مورد این مطلب نام: ایمیل: نظر: سوال: = ۲ بعلاوه ۳ دوستان مین فود آموزشگاه خیاطی انتخابات مجلس ، کاندیدای مجلس تور لوکس بالی – رویاست خرید هدیه خاص خرید و فروش خودرو طراحی سایت فیش حج قیمت بیسیم پربیننده ترین ها از روبات توانبخشی تا عصای هوشمند سه راه حل مبتنی بر هوش مصنوعی برای برگشت به زندگی روزمره به همراه فیلم رویکرد آموزشی نوین در عمره دانشجویی یادگیری تاریخ با بازدید میدانی کارت امید مادر از شروع سال ۱۴۰۵ اجرایی می شود تصمیم گیری در رابطه با آلودگی هوا بر مبنای میانگین ۲۴ ساعته است پربحث ترین ها از بیکاری پزشکان تا گسترش ظرفیت دور باطل پرهزینه قیمت بیسیم و خدمات تعمیر بیسیم هر آن چه که باید در مورد مدل هوش مصنوعی Cloud Opus 4 و شش دهم بدانید اعضای شورای راهبری کمیسیون ملی بررسی علمی اعتراضات منصوب شدند جدیدترین ها از بیکاری پزشکان تا گسترش ظرفیت دور باطل پرهزینه قیمت بیسیم و خدمات تعمیر بیسیم هر آن چه که باید در مورد مدل هوش مصنوعی Cloud Opus 4 و شش دهم بدانید اعضای شورای راهبری کمیسیون ملی بررسی علمی اعتراضات منصوب شدند امروز آخرین مهلت دریافت کارت ورود به جلسه آزمون کارشناسی به پزشکی دارویی برای کاهش کلسترول بد و خطر حمله قلبی کلسترول بالا در جوانان زنگ خطری که نباید نادیده گرفت آیا مولتی ویتامین ها می توانند خطرناک باشند؟ کشف منبع پالس های کیهانی مرموز که با سرعتی بی سابقه تکرار می شوند انتخاب فیلم برگزیده سلامت روان در جشنواره فیلم فجر از جانب وزارت بهداشت تگها بیمار بهداشت بیماری آب پزشك برنامه رپورتاژ ایمنی