هوش مصنوعی Claude 4 شرکت آنتروپیک به تازگی منتشر شده است که مطابق معمول و همانند نسل گذشته یکی از بهترین مدل ها برای برنامه نویسی است، در روز گذشته، شرکت Anthropic از مدلهای جدید خود با نامهای Claude Opus 4 و Claude Sonnet 4 رونمایی کرده است؛ مدلهایی که به گفته این شرکت و بر اساس بنچمارکهای معتبر، استانداردهای جدیدی در حوزه کدنویسی، استدلال پیشرفته و عاملهای هوش مصنوعی تعریف میکنند. Claude Opus 4 بهعنوان بهترین مدل کدنویسی جهان شناخته شده است و عملکردی پایدار در انجام وظایف پیچیده، طولانیمدت و همچنین در مدیریت گردش کارهای مبتنی بر ایجنت از خود نشان میدهد. از سوی دیگر، Claude Sonnet 4 نیز نسخهای ارتقاءیافته از Sonnet 3.7 محسوب میشود که نهتنها کدنویسی و استدلالی قویتر ارائه میدهد، بلکه با دقت بالاتری به دستورالعملهای کاربران پاسخ میدهد.
فهرست عنوان های مقاله
ویژگی های کلیدی هوش مصنوعی کلود 4
- مدل Claude Opus 4 برای وظایف پیچیده و کد نویسی
- مدل Claude Sonnet 4 با دسترسی رایگان و پیشرفت قابل توجه نسبت به نسل قبل در کد نویسی و دقت بالا
- Claude Sonnet 4 درک دقیقی از دستورالعملها و زمینههای پیچیده دارد و میتواند اشتباهات خود را شناسایی و اصلاح کند.
- Claude Sonnet 4 با ترکیب مهارتهای قوی در کدنویسی، بینایی و نوشتن، کاربردهای متنوعی را پوشش میدهد.
- Claude Sonnet 4 و Opus 4 مدلهایی hybrid هستند که دو حالت عملکرد ارائه میدهند: پاسخهای تقریباً فوری یا پاسخهایی با تفکر گامبهگام و طولانی، که این روند تفکر گسترده برای کاربر قابل مشاهده است و امکان استدلال عمیقتر را فراهم میکند.
- قابلیت ریسرچ برای ارائه تحقیق و گزارش های مستدل
- Claude Code که اکنون به طور عمومی در دسترس است.

مهم ترین امکانات هوش مصنوعی Claude 4
مدلهای Claude Opus 4 و Sonnet 4 مدلهای ترکیبی هستند که دو حالت عملکرد ارائه میدهند: پاسخهای تقریباً فوری و تفکر گسترده برای استدلال عمیقتر. هر دو مدل قادرند بهصورت همزمان از ابزارهای مختلف استفاده کنند، دستورات را با دقت بیشتری دنبال کنند و — در صورتی که توسعهدهندگان به آنها دسترسی به فایلهای محلی بدهند — توانایی حافظهای آنها بهطور چشمگیری بهبود مییابد؛ بهطوری که میتوانند اطلاعات کلیدی را استخراج کرده و ذخیره کنند تا تداوم مکالمه حفظ شود و دانش ضمنی در طول زمان شکل بگیرد.
این دو مدل همراه با قابلیت تفکر گسترده، در طرحهای Claude Pro، Max، Team و Enterprise ارائه میشوند، در حالی که Sonnet 4 برای کاربران رایگان نیز در دسترس است. هر دو مدل از طریق رابط برنامهنویسی Anthropic، Amazon Bedrock و Vertex AI گوگل کلود قابل استفاده هستند. قیمتگذاری آنها مشابه نسخههای قبلی Opus و Sonnet باقی مانده است: Opus 4 با قیمت ۱۵ دلار برای هر یک میلیون توکن ورودی و ۷۵ دلار برای خروجی، و Sonnet 4 با قیمت ۳ دلار برای ورودی و ۱۵ دلار برای خروجی، در ادامه به معرفی امکانات این هوش مصنوعی خواهیم پرداخت:
- تفکر گسترده با استفاده از ابزار (بتا)
هر دو مدل میتوانند از ابزارها – مانند جستجوی وب – در طول تفکر گسترده (Extended Thinking) استفاده کنند، که به Claude اجازه میدهد بین استدلال و استفاده از ابزار جابجا شود تا پاسخها را بهبود بخشد.
- قابلیت Claude Code
Claude Code اکنون بهصورت عمومی در دسترس است. پس از بازخورد مثبت در پیشنمایش تحقیقاتی، حالا همکاری توسعهدهندگان با Claude گسترش یافته است و پشتیبانی از وظایف پسزمینه با GitHub Actions و ادغام بومی با VS Code و JetBrains فعال شده است و همچنین ویرایشها مستقیماً در فایلها نمایش داده میشوند تا برنامهنویسی زوجی بدون وقفه انجام شود.
- قابلیت های جدید API
چهار قابلیت جدید به Anthropic API اضافه شده تا توسعهدهندگان بتوانند ایجنتهای هوش مصنوعی قدرتمندتری بسازند. ابزار اجرای کد، رابط MCP، Files API و امکان ذخیرهسازی اعلانها تا یک ساعت، حالا در دسترس هستند.
- قابلیت thinking summaries
در مدلهای Claude 4 قابلیتی جدید با عنوان خلاصهسازی فرایند فکر اضافه شده است. این قابلیت با استفاده از یک مدل کوچکتر، مسیرهای فکری طولانی را به شکل خلاصه ارائه میدهد تا خواندن و درک آنها سادهتر باشد. البته در بیشتر مواقع نیازی به این خلاصهسازی نیست، چرا که تنها در حدود ۵٪ از موارد فرایند فکر کردن مدل آنقدر طولانی میشود که خلاصهسازی لازم باشد. در باقی موارد، مسیر کامل تفکر مدل بهصورت مستقیم نمایش داده میشود. برای کاربرانی که به دسترسی کامل به مسیرهای فکری مدل نیاز دارند—مانند افرادی که در زمینهی مهندسی پیشرفتهی پرامپت فعالیت میکنند—امکان استفاده از حالت ویژهای به نام Developer Mode فراهم شده است. برای فعالسازی این حالت میتوان با تیم فروش تماس گرفت.
معرفی Claude Opus 4
Claude Opus 4 قدرتمندترین مدل ارائهشده تاکنون است و بهعنوان بهترین مدل کدنویسی در جهان شناخته میشود. این مدل در آزمونهای SWE-bench با امتیاز ۷۲٫۵٪ و Terminal-bench با امتیاز ۴۳٫۲٪ پیشتاز است. Claude Opus 4 عملکرد پایداری در وظایف طولانیمدت دارد که نیازمند تلاش متمرکز و هزاران گام است؛ بهطوری که میتواند چندین ساعت بهصورت مداوم کار کند و در این زمینه بهطور چشمگیری از تمامی مدلهای Sonnet پیشی میگیرد و افق توانمندیهای عاملهای هوش مصنوعی را بهطور قابلتوجهی گسترش میدهد.
مدل Claude Opus 4 در زمینههایی مانند کدنویسی پیشرفته، عاملهای هوشمند، تحقیق خودکار و تولید محتوا عملکردی در سطح جهانی دارد. این مدل با قابلیت استدلال ترکیبی، هم پاسخهای سریع و هم تحلیلهای مرحلهبهمرحله ارائه میدهد و بهطور ویژه برای مدیریت وظایف پیچیده و طولانیمدت طراحی شده است.
موارد استفاده کلیدی
- ایجنت های هوشمند: مناسب برای اجرای وظایف پیچیده با دقت بالا، از جمله مدیریت مستقل پروژههای چندبخشی.
- کدنویسی: پیشرو در آزمون SWE-bench، توانمند در حل مسائل پیچیده برنامهنویسی با درک عمیق از متن و سبک کدنویسی.
- تحقیقات عاملمحور: قابلیت جستجوی گسترده در منابع داخلی و خارجی برای استخراج بینشهای تحلیلی و استراتژیک.
- تولید محتوا: تولید متنی طبیعی، انسانی و خلاقانه با کیفیتی بالاتر از نسخههای قبلی.
این مدل در زمینهی کدنویسی و حل مسائل پیچیده عملکرد بینظیری دارد و موتور محرک محصولات ایجنت های پیشرفته است. شرکت Cursor آن را پیشرفتهترین مدل برای کدنویسی و جهشی بزرگ در درک پایگاههای کد پیچیده توصیف کرده است. Replit از افزایش دقت و پیشرفت چشمگیر در اعمال تغییرات پیچیده در چندین فایل خبر داده است. Block Claude Opus 4 را نخستین مدلی میداند که توانسته کیفیت کد را هنگام ویرایش و اشکالزدایی در عامل خود با نام رمزی goose ارتقا دهد، آنهم بدون افت عملکرد یا قابلیت اطمینان. شرکت Rakuten با اجرای یک بازسازی متنباز دشوار که بهمدت ۷ ساعت بهطور مستقل اجرا شد، توانمندی این مدل را تأیید کرده است. شرکت Cognition نیز اشاره کرده که Opus 4 در حل چالشهای پیچیدهای که سایر مدلها از عهدهی آن برنیامدهاند، موفق بوده و میتواند اقداماتی حیاتی را با دقت انجام دهد.
معرفی Claude Sonnet 4
مدل Claude Sonnet 4 نسخهای پیشرفتهتر از Claude Sonnet 3.7 است که در زمینههای مختلف، بهویژه کدنویسی، بهطور چشمگیری بهبود یافته است. این مدل با عملکردی در سطح پیشرفته، گزینهای عملی و قابل اتکا برای بسیاری از کاربردهای هوش مصنوعی محسوب میشود؛ از جمله دستیارهای هوش مصنوعی کاربرمحور، وظایف با حجم بالا، و کاربردهای سازمانی. Sonnet 4 با کسب ۷۲٫۷٪ دقت در معیار SWE-bench (معیاری استاندارد برای ارزیابی توان مدلها در حل مسائل واقعی مهندسی نرمافزار)، همچنان در ردهی مدلهای پیشتاز در حوزهی کدنویسی قرار دارد. این مدل تعادلی مناسب میان کارایی و بهرهوری فراهم کرده و برای استفادههای داخلی و خارجی، انتخابی مناسب به شمار میآید. با اینکه در بسیاری از حوزهها به سطح مدل قدرتمندتر Opus 4 نمیرسد، اما ترکیبی بهینه از توانمندی و کاربردپذیری را ارائه میدهد.
مدل Sonnet 4 توانایی درک دستورات پیچیده و زمینههای معنایی ظریف را دارد، میتواند اشتباهات خود را شناسایی و اصلاح کند و از دادههای پیچیده، تحلیلهای پیشرفته و بینشهای کاربردی استخراج نماید. ترکیب این تواناییها با مهارتهای قوی در کدنویسی، نگارش، پردازش دیداری و تحلیل دادهها، این مدل را به ابزاری چندمنظوره و قدرتمند برای طیف گستردهای از سناریوها تبدیل کرده است.
از جمله کاربردهای محبوب Sonnet 4 میتوان به موارد زیر اشاره کرد:
- ساخت عاملهای کاربرمحور هوشمند با قابلیت پیروی دقیق از دستورات، انتخاب ابزار مناسب، تصحیح خطاها و استدلال پیشرفته
- تولید و اصلاح کد در تمامی مراحل توسعه نرمافزار، از برنامهریزی تا نگهداری و بازسازیهای گسترده
- کنترل رایانه از طریق API، با شبیهسازی عملکرد انسان در تعامل با واسط کاربری
- طراحی چتباتهای پیشرفته با توانایی ترکیب داده، استدلال، و اتخاذ تصمیم
- پاسخگویی دقیق به سؤالات مبتنی بر اسناد، پایگاههای دانش و کدهای طولانی
- استخراج اطلاعات از دادههای تصویری مانند نمودارها و دیاگرامهای پیچیده
- تولید محتوا با درک دقیق لحن و سبک و همچنین تحلیل متون با عمق بالا
- اتوماسیون فرایندهای تکراری و پیچیده در قالب RPA (اتوماسیون رباتیک فرآیندها)
از نظر فنی، Sonnet 4 دارای قابلیت پاسخدهی لحظهای یا استدلال مرحلهای قابل مشاهده برای کاربر است و از پنجره متنی گستردهای تا ۶۴هزار توکن خروجی پشتیبانی میکند. همچنین، کاربران API میتوانند میزان تفکر مدل را بهصورت دقیق کنترل کنند.
برای مثال شرکت GitHub اعلام کرده که Sonnet 4 در سناریوهای عاملمحور عملکرد درخشانی دارد و از آن در مدل جدید عامل کدنویسی GitHub Copilot استفاده خواهد کرد. ایجنت هوش مصنوعی Manus از بهبود پیروی از دستورالعملهای پیچیده، استدلال شفاف، و خروجیهای زیباشناسانهی آن یاد کرده است. شرکت iGent عملکرد بالای Sonnet 4 را در توسعهی مستقل اپلیکیشنهای چندویژگی و کاهش خطاهای ناوبری از ۲۰٪ به نزدیک صفر گزارش داده است. Sourcegraph این مدل را جهشی قابلتوجه در توسعهی نرمافزار میداند که میتواند تمرکز طولانیتری حفظ کرده، مسائل را عمیقتر درک کند و کدی با کیفیتی ظریفتر ارائه دهد. شرکت Augment Code نیز از نرخ موفقیت بالاتر، ویرایشهای دقیقتر، و دقت بیشتر در انجام وظایف پیچیده خبر داده و Sonnet 4 را مدل اصلی خود انتخاب کرده است.
در مجموع، این دو مدل استراتژی هوش مصنوعی مشتریان را در ابعاد مختلف ارتقا میدهند: Opus 4 مرزهای جدیدی در زمینههایی مانند کدنویسی، تحقیق، نویسندگی و کشف علمی ایجاد میکند، در حالی که Sonnet 4 عملکردی در سطح پیشرفته را برای کاربردهای روزمره بهعنوان جایگزینی سریع و قدرتمند برای Sonnet 3.7 فراهم میآورد.
بهبود های مدل Claude 4
در نسخههای جدید مدلهای Claude، علاوه بر بهبودهایی مانند تفکر گامبهگام طولانیتر، توانایی استفاده همزمان از چند ابزار و حافظه قویتر، یک پیشرفت مهم دیگر نیز حاصل شده است: این مدلها اکنون تا ۶۵٪ کمتر از گذشته به دنبال استفاده از میانبرها یا راههای تقلبی برای انجام وظایف خود هستند—خصوصاً در وظایف پیچیدهای که احتمال چنین رفتارهایی در آنها بالاست.
منظور از «راه میانبر» در اینجا، حالتی است که مدل بهجای حل واقعی و دقیق یک مسئله، راهحلی سطحی یا ظاهری ارائه میدهد که تنها شبیه به پاسخ درست به نظر میرسد، اما در عمل مسئله را دور میزند. برای مثال، ممکن است مدلی در پاسخ به یک مسئله برنامهنویسی، کدی تولید کند که ظاهراً منطقی به نظر برسد اما از نظر فنی درست عمل نکند.
علاوه بر این، Claude Opus 4 از قابلیتهای حافظه پیشرفتهتری نیز برخوردار است. این یعنی میتواند اطلاعات کلیدی و مرتبطی را که در طول زمان در اختیارش قرار میگیرد، ذخیره کرده و در مراحل بعدی از آنها استفاده کند. در صورتی که توسعهدهندگان به این مدل اجازه دسترسی به فایلهای محلی (local files) را بدهند، Claude قادر خواهد بود بهصورت خودکار فایلهایی ایجاد کند که بهعنوان «فایلهای حافظه» برای ذخیره اطلاعات مهم عمل میکنند.
این قابلیت، بهویژه در انجام وظایف طولانیمدت و چندمرحلهای—مانند پروژههای نرمافزاری یا بازیهای ویدیویی—کارایی مدل را به شکل چشمگیری افزایش میدهد. بهعنوان نمونه، در یکی از تستها که مدل مشغول انجام بازی Pokémon بود، Claude Opus 4 بهطور خودکار فایلی به نام «راهنمای مسیریابی» ایجاد کرد تا مسیرها و اطلاعات مهم بازی را ثبت کرده و در مراحل بعدی از آنها بهره بگیرد. چنین تواناییهایی موجب میشود عملکرد مدلها طبیعیتر، منسجمتر و مؤثرتر باشد.

آخرین تغییرات Claude Code
Claude Code اکنون بهصورت عمومی عرضه شده و امکان استفاده از قابلیتهای مدل Claude را در بخشهای مختلف فرآیند برنامهنویسی فراهم میکند—از جمله در ترمینال، ویرایشگرهای محبوب مانند VS Code و JetBrains، و همچنین در پسزمینه از طریق Claude Code SDK. افزونههای جدیدی برای VS Code و JetBrains در نسخه بتا ارائه شدهاند که Claude Code را مستقیماً در محیط IDE ادغام میکنند. پیشنهادهای کدی مدل بهصورت درونخطی (inline) در فایلها نمایش داده میشوند، که بررسی و پیگیری تغییرات را برای توسعهدهنده آسانتر میکند. نصب این ابزار از طریق اجرای دستور Claude Code در ترمینال IDE انجام میشود. علاوه بر این، Claude Code SDK نیز منتشر شده که به توسعهدهندگان امکان میدهد عاملها و اپلیکیشنهای سفارشیشدهای را با استفاده از هسته Claude Code طراحی کنند. بهعنوان نمونه، نسخهی بتای Claude Code برای GitHub معرفی شده که در آن میتوان این مدل را روی Pull Requestها تگ کرد تا به بازخوردها پاسخ دهد، خطاهای CI را اصلاح کند یا تغییرات لازم در کد را اعمال نماید. نصب این نسخه با اجرای دستور /install-github-app از داخل محیط Claude Code انجام میشود.
بررسی بنچمارک های هوش مصنوعی Claude 4

این تصویر نمودار میلهای عملکرد مدلهای مختلف هوش مصنوعی را در حوزه مهندسی نرمافزار نمایش میدهد. عملکرد مدلها براساس دقت (Accuracy) و با استفاده از معیار استاندارد SWE-bench ارزیابی شده است. این معیار، توانایی مدلها را در حل مسائل واقعی برنامهنویسی و مهندسی نرمافزار اندازهگیری میکند. در این نمودار، دقت مدلها بهصورت درصدی نمایش داده شده و مدلها از بالاترین تا پایینترین دقت در محور افقی مرتب شدهاند.
- Claude Sonnet 4 با دقت ۸۰.۲٪ (در حالت استفاده از محاسبات موازی در زمان تست) و ۷۲.۷٪ بدون آن، بالاترین عملکرد را در میان مدلها داشته است.
- Claude Opus 4 نیز با دقت ۷۹.۴٪ (با محاسبه موازی) و ۷۲.۵٪ بدون آن، در رتبه دوم قرار دارد.
- OpenAI Codex-1 با دقت ۷۲.۱٪
- OpenAI o3 با دقت ۶۹.۱٪
- Gemini 2.5 Pro با دقت ۶۳.۲٪
- Claude Sonnet 3.7 با دقت ۷۰.۳٪ (با محاسبه موازی) و ۶۲.۳٪ بدون آن
- در نهایت، OpenAI GPT-4.1 با دقت ۵۴.۶٪، پایینترین عملکرد را در این مقایسه داشته است.
لازم به ذکر است که “with parallel test-time compute” به این معناست که مدل در زمان تست از محاسبات موازی استفاده کرده است، که معمولاً موجب بهبود دقت در پاسخگویی میشود. بهطور کلی، این نمودار نشان میدهد که مدلهای Claude Sonnet 4 و Opus 4 عملکرد بسیار بالاتری نسبت به سایر مدلها در انجام وظایف مرتبط با مهندسی نرمافزار داشتهاند، بهویژه زمانی که از محاسبات موازی بهره بردهاند.

در این بنچمارک، عملکرد مدلهای مختلف هوش مصنوعی شامل Claude Opus 4، Claude Sonnet 4، Claude Sonnet 3.7، OpenAI o3، OpenAI GPT-4.1 و Gemini 2.5 Pro در طیف گستردهای از وظایف ارزیابی شده است. این وظایف شامل کدنویسی عاملمحور، استدلال سطح بالا، استفاده از ابزار، درک چندزبانه، استدلال بصری و ریاضی در سطح دبیرستان است.
1. کدنویسی عاملمحور (SWE-bench Verified)
Claude Opus 4 و Sonnet 4 به ترتیب با دقت ۷۹.۴٪ و ۸۰.۲٪ در حالت محاسبه موازی، برترین عملکرد را دارند. این دو مدل در حل وظایف پیچیدهی کدنویسی با کمک ابزارها از سایرین پیشی گرفتهاند.
2. کدنویسی عاملمحور در محیط ترمینال (Terminal-bench)
در این شاخص نیز Opus 4 با دقت ۵۰.۰٪ و Sonnet 4 با ۴۱.۳٪ در حالت موازی عملکرد بهتری نسبت به سایر مدلها مانند GPT-4.1 (۳۰.۳٪) و Gemini (۲۵.۳٪) داشتهاند.
3. استدلال سطح تحصیلات تکمیلی (GPQA Diamond)
مدلهای OpenAI o3 (۸۳.۳٪) و Gemini 2.5 Pro (۸۳.۰٪) در این آزمون بسیار موفق بودهاند. Claude Sonnet 4 نیز با ۸۳.۸٪ دقت در حالت موازی عملکرد قابل قبولی از خود نشان داده است.
4. استفاده عاملمحور از ابزارها (TAU-bench)
Claude Opus 4 و Sonnet 4 با دقتهای ۸۱.۴٪ و ۸۰.۵٪ در وظایف مرتبط با استفاده از ابزار در محیطهای مختلف (خردهفروشی و خطوط هوایی) پیشتاز هستند. دادهای برای Gemini در این بخش ارائه نشده است.
5. پاسخگویی چندزبانه (MMLU13)
در ارزیابی چندزبانه، Claude Opus 4 و OpenAI o3 با دقت ۸۸.۸٪ عملکرد یکسان و بسیار خوبی داشتهاند. سایر مدلها نیز در این حوزه نتایج نسبتاً نزدیک به هم دارند.
6. استدلال بصری (MMMU)
مدل OpenAI o3 با دقت ۸۲.۹٪ بهترین عملکرد را در زمینه استدلال بصری داشته است. Claudeها و Gemini نیز عملکرد قابل قبولی بین ۷۴٪ تا ۷۹.۶٪ دارند.
7. ریاضیات سطح دبیرستان (AIME 2025)
در این حوزه نیز OpenAI o3 با دقت ۸۸.۹٪ در صدر قرار دارد. Gemini با ۸۳.۰٪ و Claude Opus 4 با ۹۰.۰٪ (در حالت محاسبه موازی) نیز عملکرد بسیار خوبی دارند. GPT-4.1 در این دسته ارزیابی نشده است.
در مجموع، مدلهای Claude Opus 4 و Claude Sonnet 4 عملکردی قوی و پایدار در طیف متنوعی از وظایف، بهویژه در کدنویسی عاملمحور و استفاده از ابزارها از خود نشان دادهاند. از سوی دیگر، OpenAI o3 در استدلال سطح بالا، استدلال بصری و ریاضی پیشتاز است. در نهایت، Gemini 2.5 Pro نیز در برخی زمینهها مانند استدلال تحصیلات تکمیلی و ریاضی عملکرد رقابتی دارد، اما در وظایف کدنویسی عقبتر است.
دانلود و نصب هوش مصنوعی Claude 4
در حال حاضر شما برای استفاده هوش مصنوعی کلود میتوانید به وبسایت این هوش مصنوعی با استفاده از این آدرس https://claude.ai دسترسی داشته باشید و با استفاده از آدرس ایمیل و یا شماره تلفن ثبت نام کنید.
همچنین اپلیکیشن هوش مصنوعی Claude 4 برای اندروید از این لینک و برای گوشی های ios از این لینک قابل دانلود و نصب است.
نکته مهم برای ثیت نام در Claude: شما برای ثبت نام و استفاده از هوش مصنوعی Claude 4 نیاز دارید که شماره تلفن خود را احراز هویت کنید و با وجود این که پیش شماره ایران و امکان وارد کردن شماره تلفن های ایران وجود دارد، شما با ارور unsupported phoen number مواجه خواهید شد و نمیتوانید شماره تلفن های ایرانی را تایید کنید، در نتیجه برای رفع این مشکل نیاز دارید با استفاده از یک شماره خارجی متعلق به خودتان یا شماره مجازی اقدام به احراز هویت کنید.




