اصطلاحات کلیدی هوش مصنوعی / هوش مصنوعی دیگر یک مفهوم علمیتخیلی نیست، بلکه به بخشی جداییناپذیر از دنیای امروز تبدیل شده است. از چتباتهای هوشمند گرفته تا خودروهای خودران، این فناوری در حال تغییر شیوهٔ کار، ارتباط و تصمیمگیری ماست. اما هوش مصنوعی تنها یک عنوان کلی نیست؛ بلکه شامل شاخههای مختلفی مانند یادگیری ماشین، پردازش زبان طبیعی، بینایی کامپیوتر و رباتیک میشود که هرکدام در حوزهای خاص قدرتنمایی میکنند.
درک اصطلاحات کلیدی هوش مصنوعی به ما کمک میکند تا فناوریهایی که آینده را شکل میدهند، بهتر بشناسیم. در این مطلب، نگاهی خواهیم داشت به مهمترین مفاهیم و زیرشاخههای هوش مصنوعی و نقش آنها در دنیای دیجیتال.
هوش مصنوعی (Artificial Intelligence)
هوش مصنوعی به سیستمها یا برنامههایی گفته میشود که قادرند وظایفی را انجام دهند که معمولاً به هوش انسانی نیاز دارد. این وظایف میتواند شامل یادگیری، حل مسئله، درک زبان یا تصمیمگیری باشد. هدف اصلی هوش مصنوعی این است که ماشینها بتوانند به طور خودکار از تجربهها بیاموزند و در موقعیتهای مختلف عملکردی شبیه انسان داشته باشند. بهعنوانمثال، یک دستیار هوشمند مانند سیری (Siri) یا گوگلاسیستنت (Google Assistant) میتواند گفتار انسان را درک کرده و به پرسشها پاسخ دهد که این خود نمودی از هوش مصنوعی است.
عامل هوش مصنوعی (AI Agent)
یک عامل هوش مصنوعی سیستمی است که میتواند بهصورت خودکار و با استفاده از فناوریهای هوش مصنوعی وظایف خاصی را انجام دهد. این عاملها ممکن است یک چتبات ساده باشند که به سؤالات پاسخ میدهد یا یک سیستم پیچیده که اقدامات چندمرحلهای را بدون دخالت انسان انجام میدهد. تفاوت عاملهای هوش مصنوعی با مدلهای سادهتر در این است که آنها معمولاً توانایی برنامهریزی، تصمیمگیری و تعامل پویا با محیط را دارند.
برای مثال، یک دستیار مجازی هوشمند مانند سیری (Siri) یا گوگلاسیستنت (Google Assistant) میتواند برخی وظایف را اجرا کند، اما یک عامل هوش مصنوعی پیشرفته ممکن است بهجای پاسخ به درخواستهای مجزا، مجموعهای از وظایف را بهصورت خودکار و پیوسته انجام دهد، مانند رزرو بلیط هواپیما، مدیریت ایمیلها و تنظیم جلسات بر اساس برنامهریزیهای کاربر. برخی از عاملهای هوش مصنوعی درحالتوسعه حتی قادرند از مدلهای مختلف هوش مصنوعی برای اجرای فرایندهای پیچیده استفاده کنند، مانند سیستمهایی که بهطور خودکار کد مینویسند و آن را ویرایش میکنند.
یادگیری ماشین (Machine Learning)
یادگیری ماشین یکی از زیرشاخههای هوش مصنوعی است که در آن رایانهها توانایی یادگیری از دادهها را پیدا میکنند، بدون اینکه برای هر وظیفه به طور صریح برنامهنویسی شوند. به عبارتی، در یادگیری ماشین الگوریتمها با استفاده از دادههای نمونه (مثلاً مجموعهای از تصاویر یا جدولهایی از ارقام و سوابق) آموزش میبینند و الگوها و روابط پنهان در دادهها را کشف میکنند. پس از آموزش، مدل یادگیری ماشین میتواند روی دادههای جدید پیشبینی انجام دهد یا تصمیماتی بگیرد. برای نمونه، سیستمهای توصیهگر فیلم و موسیقی (مثل آنچه در نتفلیکس یا اسپاتیفای میبینیم) با یادگیری از سلیقه و سابقۀ کاربران، محتوای جدید متناسب با علاقۀ آنها پیشنهاد میدهند. همچنین فیلترهای هرزنامۀ ایمیل با یادگیری از نمونههای ایمیلهای اسپم و عادی، میآموزند که ایمیلهای ناخواسته را تشخیص دهند.
یادگیری عمیق (Deep Learning)
یادگیری عمیق زیرمجموعهای تخصصی از یادگیری ماشین است که به استفاده از شبکههای عصبی چندلایه (اصطلاحاً عمیق) برای یادگیری از دادهها میپردازد. در این روش، دادهها از سلسلهمراتب لایههای مختلف عبور میکنند و هر لایه ویژگیهای پیچیدهتری را از داده استخراج میکند. به دلیل وجود همین لایههای متعدد، یک مدل یادگیری عمیق میتواند الگوها و مفاهیم سطح بالا (مانند تشخیص چهره یا درک معنی یک جمله) را بهخوبی بیاموزد.
کاربردهای یادگیری عمیق را میتوان در بسیاری از فناوریهای پیشرفته مشاهده کرد. برای مثال، «تشخیص صدا» در دستیارهای صوتی (مانند الکسا یا گوگل) و «بینایی ماشین» در خودروهای خودران برای شناسایی عابرین پیاده یا علائم راهنمایی، هر دو مبتنی بر مدلهای یادگیری عمیق هستند. همچنین در حوزههایی مانند تشخیص بیماری از روی تصاویر پزشکی، ترجمهٔ ماشینی زبانها و حتی خلق تصاویر و متون جدید (هوش مصنوعی مولد)، یادگیری عمیق نقش کلیدی ایفا میکند.
شبکههای عصبی مصنوعی (Artificial Neural Networks)
شبکههای عصبی مصنوعی مدلهای محاسباتی الهامگرفته از ساختار مغز انسان هستند. این شبکهها از تعداد زیادی واحد ساده به نام نورون تشکیل شدهاند که در لایههایی مرتب شده و به یکدیگر متصل هستند. هر نورون ورودیهایی را از نورونهای لایهٔ قبل دریافت کرده و پس از اعمال یک وزن (عدد تنظیمپذیر) و یک تابع ریاضی، خروجی خود را به نورونهای لایهٔ بعد منتقل میکند. شبکهٔ عصبی با تنظیم این وزنها طی فرایند آموزش، میتواند الگوهای پیچیده را در دادهها یاد بگیرد. برای مثال، یک شبکهٔ عصبی ممکن است با مشاهدهٔ هزاران تصویر دستنویس اعداد، به تدریج نحوهٔ تشخیص ارقام ۰–۹ را فرا گیرد. شبکههای عصبی پایهٔ اصلی بسیاری از روشهای یادگیری ماشین (بهویژه یادگیری عمیق) هستند و در مسائلی مانند تشخیص تصویر، تشخیص گفتار و بازیهای رایانهای به کار میروند.
وزنها (Weights)
وزنها یکی از مهمترین اجزای شبکههای عصبی مصنوعی هستند که تعیین میکنند مدل هوش مصنوعی چگونه دادهها را پردازش کرده و تصمیمگیری کند. وزنها در واقع ضرایبی عددی هستند که هنگام عبور دادهها از نورونهای شبکۀ عصبی اعمال میشوند و نقش تعیینکنندهای در یادگیری مدل دارند.
نحوۀ عملکرد وزنها به این گونه است که هر نورون در شبکۀ عصبی دارای چندین ورودی است که از نورونهای لایۀ قبلی دریافت میکند. مقدار ورودیها با وزنهای خاصی ضرب میشود که نشان میدهد هر ورودی چقدر اهمیت دارد. سپس مجموع این مقادیر از یک تابع ریاضی (مانند تابع فعالسازی) عبور میکند و نتیجه به نورون بعدی ارسال میشود. در طی فرایند یادگیری، مدل وزنها را تنظیم میکند تا خروجیهای مطلوبتری تولید کند.
مثال: در یک مدل هوش مصنوعی که برای پیشبینی قیمت خانه آموزش داده شده، وزنها ممکن است تعیین کنند که متراژ خانه نسبت به سن بنا اهمیت بیشتری دارد. در ابتدا، وزنها بهطور تصادفی تنظیم میشوند، اما با آموزش مدل و ارزیابی خروجیها، این وزنها تغییر میکنند تا دقت مدل افزایش یابد.
در یادگیری عمیق، تعداد وزنها بسیار زیاد است (گاهی تا میلیاردها پارامتر)، که همین مسئله موجب نیاز به سختافزار قدرتمند مانند پردازندههای گرافیکی (GPU) برای آموزش مدلهای بزرگ میشود. بهینهسازی وزنها طی فرایندی به نام پسانتشار (Backpropagation) انجام میشود که به مدل امکان میدهد با هر مرحلۀ آموزش، خطای خود را کاهش دهد.
یادگیری نظارتشده (Supervised Learning)
یادگیری نظارتشده یکی از روشهای یادگیری ماشین است که در آن مدل با استفاده از دادههای برچسبگذاریشده آموزش میبیند. منظور از برچسبگذاریشده این است که برای هر نمونۀ ورودی، خروجی یا پاسخ صحیح آن از قبل مشخص شده است. مدل با مشاهدهٔ تعداد زیادی از این نمونههای ورودی-خروجی، یاد میگیرد که چگونه از روی ورودیها، خروجی مناسب را پیشبینی کند. برای مثال، یک الگوریتم نظارتشده میتواند با استفاده از هزاران تصویر گربه و سگ (که روی هر تصویر برچسب «گربه» یا «سگ» خورده)، یاد بگیرد که در یک تصویر جدید تشخیص دهد حیوان داخل آن گربه است یا سگ. پس از آموزش، مدل نظارتشده میتواند روی دادههای جدید که برچسبشان نامعلوم است، پیشبینی انجام دهد (مثلاً یک ایمیل جدید را به دستهٔ اسپم یا عادی طبقهبندی کند).
یادگیری بدون نظارت (Unsupervised Learning)
یادگیری بدون نظارت روشی در یادگیری ماشین است که با دادههای بدون برچسب سروکار دارد. یعنی دادههایی که خروجی یا دستهبندی مشخصی برای آنها تعریف نشده است. هدف الگوریتمهای بدون نظارت این است که الگوها، خوشهها یا ساختارهای پنهان در این دادهها را کشف کنند. برای مثال، یک الگوریتم بدون نظارت میتواند مجموعهای از تصاویر را بر اساس شباهتهایشان به چند گروه تقسیم (خوشهبندی) کند، بدون اینکه بداند هر تصویر چه چیزی را نمایش میدهد. یا در یک مجموعه از دادههای مشتریان، الگوریتم بدون نظارت میتواند مشتریان را به گروههای مشابه از نظر رفتار خرید تقسیمبندی کند. خروجی یادگیری بدون نظارت ممکن است به صورت گروهبندی دادههای مشابه، کاهش ابعاد دادهها (فشردهسازی اطلاعات) یا کشف روابط پنهان ظاهر شود که در مرحلهٔ بعد میتواند برای تصمیمگیری یا یادگیری نظارتشده به کار رود.
یادگیری تقویتی (Reinforcement Learning)
یادگیری تقویتی رویکردی در یادگیری ماشین است که بر اساس پاداش و جریمه عمل میکند. در این روش، یک عامل هوشمند (مانند یک ربات یا یک برنامهٔ کامپیوتری) در محیطی قرار میگیرد و اقداماتی انجام میدهد. هر اقدام این عامل، متناسب با خوب یا بد بودن، از محیط بازخورد دریافت میکند که میتواند مثبت (پاداش) یا منفی (جریمه) باشد. هدف عامل هوشمند این است که با آزمون و خطا، راهبردی را یاد بگیرد که بیشترین پاداش ممکن را دریافت کند.
برای نمونه، الگوریتمهای یادگیری تقویتی میتوانند یک عامل نرمافزاری را آموزش دهند که چگونه یک بازی رایانهای را انجام دهد: برنامه حرکتهای مختلف را امتحان میکند و بر اساس امتیازی که میگیرد (پاداش)، یاد میگیرد که کدام حرکتها بهتر هستند. به تدریج، عامل هوش مصنوعی بازی را به شکلی انجام میدهد که بیشترین امتیاز را کسب کند. نمونههای مشهور این رویکرد، آموزش یک هوش مصنوعی برای شکست دادن قهرمانان بازی شطرنج یا Go (مانند AlphaGo) و همچنین آموزش رباتهای واقعی برای حرکت و راه رفتن بدون افتادن است.
پردازش زبان طبیعی (Natural Language Processing – NLP)
پردازش زبان طبیعی شاخهای از هوش مصنوعی است که به تعامل کامپیوتر و زبان انسان میپردازد. هدف NLP این است که رایانه بتواند زبان انسان (متن یا گفتار) را درک کند و حتی تولید نماید. به کمک تکنیکهای این حوزه، کامپیوترها میتوانند وظایفی مانند ترجمهٔ ماشینی (مثلاً ترجمهٔ خودکار متون از فارسی به انگلیسی)، تشخیص احساس در متن (اینکه مثلاً یک نقد سینمایی لحنی مثبت دارد یا منفی)، پاسخ به سؤالات (مانند چتباتها و دستیارهای هوشمند) و خلاصهسازی متون را انجام دهند. پردازش زبان طبیعی از الگوریتمهای یادگیری ماشین و گاه شبکههای عصبی عمیق برای تحلیل متن و گفتار بهره میگیرد. نمونههای ملموس از NLP که بسیاری از ما با آنها سروکار داریم شامل موتورهای جستجو (که سؤالات ما را میفهمند و نتایج مرتبط نشان میدهند)، دستیارهای صوتی (مثل Siri یا Google Assistant) و سیستمهای تبدیل گفتار به متن (مانند قابلیت دیکتهگویی در گوشیهای هوشمند) است.
مدل زبانی بزرگ (Large Language Model – LLM)
مدل زبانی بزرگ یا LLM نوعی مدل یادگیری عمیق است که بر اساس دادههای بسیار وسیع زبانی آموزش دیده و میتواند زبان انسان را پردازش و تولید کند. این مدلها میلیاردها پارامتر دارند و با استفاده از شبکههای عصبی عمیق، رابطههای بین کلمات، جملات و مفاهیم را یاد میگیرند.
نحوۀ عملکرد LLM به این شکل است که مدل ابتدا مقدار عظیمی از متون را بررسی میکند و الگوهای زبانی را شناسایی میکند. وقتی یک کاربر سؤالی را مطرح میکند، مدل پاسخ را بر اساس پیشبینی محتملترین کلمات بعدی تولید میکند. مدلهای مدرن، علاوه بر تولید متن، میتوانند از ابزارهای جانبی مانند مرور وب، پردازش کد، یا ترجمۀ زبان استفاده کنند.
نمونههای شناختهشده از مدلهای زبانی بزرگ شامل لاما شرکت متا (Llama)، جمینای گوگل (Gemini)، کلاود (Claude) و چتجیپیتی اوپنایآی (ChatGPT) هستند.
کاربردهای مدلهای زبانی بزرگ:
- پاسخ به سؤالات کاربران (چتباتها و دستیارهای هوشمند)
- ترجمۀ خودکار متون
- تولید محتوای متنی (مانند مقالات، داستانها و ایمیلها)
- تحلیل دادههای متنی و خلاصهسازی اسناد
- برنامهنویسی خودکار و تصحیح کدهای نرمافزاری
با اینکه مدلهای LLM ابزارهای قدرتمندی هستند، اما گاهی اوقات ممکن است پاسخهای نادرست یا گمراهکننده ارائه دهند، چراکه درک واقعی از جهان ندارند و فقط بر اساس الگوهای آماری عمل میکنند.
زنجیرۀ تفکر (Chain of Thought – CoT)
زنجیرۀ تفکر یک روش در پردازش زبان طبیعی و مدلهای هوش مصنوعی است که در آن، مسئله به مراحل کوچکتر شکسته میشود تا نتیجۀ نهایی دقیقتر و صحیحتر باشد. این تکنیک باعث میشود که مدلهای زبانی فرایند حل مسئله را مشابه انسان طی کنند، یعنی بهجای ارائۀ پاسخهای سریع و سطحی، ابتدا مراحل استدلال را تحلیل کرده و سپس نتیجهگیری کنند. برای مثال، اگر از یک مدل زبانی پرسیده شود «اگر یک کشاورز ۲۰ مرغ و ۱۵ گاو داشته باشد، مجموع پاهای حیوانات چقدر است؟» یک مدل ساده ممکن است مستقیماً پاسخی نادرست ارائه دهد، اما مدلی که زنجیرۀ تفکر را بهکار میگیرد، ابتدا مراحل زیر را طی میکند:
- مرغها هر کدام ۲ پا دارند. پس ۲۰ مرغ جمعاً ۴۰ پا دارند.
- گاوها هر کدام ۴ پا دارند پس ۱۵ گاو جمعاً ۶۰ پا دارند.
- مجموع پاها برابر با ۱۰۰ خواهد بود.
در نتیجه، مدل با دقت بیشتری پاسخ صحیح ۱۰۰ پا را ارائه میدهد.
این روش بهویژه در حل مسائل ریاضی، منطق، برنامهنویسی و استدلال پیچیده مفید است و باعث میشود مدلهای زبانی عملکرد بهتری در وظایف نیازمند تفکر چندمرحلهای داشته باشند.
تنظیم دقیق (Fine-tuning)
تنظیم دقیق فرایندی در یادگیری ماشین و هوش مصنوعی است که در آن یک مدل از پیشآموزشدیده (مانند یک مدل زبانی بزرگ) با استفاده از دادههای جدید و خاص، دوباره آموزش داده میشود تا عملکرد آن در یک حوزه یا وظیفۀ خاص بهبود یابد. این روش بهویژه زمانی استفاده میشود که نیاز به سفارشیسازی یک مدل عمومی برای یک کاربرد مشخص وجود دارد.
برای مثال، مدلهای زبانی عمومی مانند GPT ابتدا با حجم عظیمی از دادههای متنی آموزش داده میشوند، اما ممکن است برای یک وظیفۀ خاص مانند تحلیل اسناد پزشکی، پشتیبانی مشتری یا تولید محتوای حقوقی، بهینه نباشند. در اینجا، تنظیم دقیق انجام میشود. دادههای تخصصی مرتبط با زمینۀ موردنظر جمعآوری میشوند. مدل با این دادهها مجدداً آموزش داده میشود تا درک بهتری از زبان تخصصی و کاربردهای خاص داشته باشد. سپس مدل بهینهشده عملکرد بهتری در وظایف مرتبط با این حوزه ارائه میدهد.
این روش یکی از متداولترین راههای استفادۀ تجاری از هوش مصنوعی است، چراکه به شرکتها اجازه میدهد مدلهای هوش مصنوعی را متناسب با نیازهای خود تنظیم کنند. برای مثال، یک مدل زبان که برای گفتوگوهای عمومی مناسب است، میتواند از طریق تنظیم دقیق برای پشتیبانی مشتری در بانکداری یا تولید محتوای علمی بهینه شود.
بینایی کامپیوتر (Computer Vision)
بینایی کامپیوتر شاخهای از هوش مصنوعی است که به درک تصاویر و ویدئوها توسط ماشین میپردازد. در این حوزه، سیستمهای کامپیوتری تلاش میکنند اطلاعات بصری را مانند چشم و مغز انسان پردازش و تفسیر کنند. الگوریتمهای بینایی کامپیوتر قادرند در تصاویر دیجیتال وظایفی مانند تشخیص اشیا (مثلاً شناسایی وجود گربه در یک عکس)، تشخیص چهره (پیدا کردن هویت یا تمایز چهرهها در یک تصویر)، شناسایی الگوها و ویژگیها (مانند تشخیص دستخط یا تشخیص بیماری در تصاویر پزشکی) و ردیابی اشیا در ویدئو را انجام دهند. یکی از کاربردهای مهم بینایی کامپیوتر در خودروهای خودران است که باید با تحلیل تصاویر دوربینها، عابرین پیاده، خودروهای دیگر و علائم جاده را تشخیص دهند و واکنش مناسب نشان دهند. همچنین در حوزههایی مثل نظارت امنیتی (تشخیص حرکت مشکوک در تصاویر دوربین مداربسته) و واقعیت افزوده (شناسایی محیط برای جایگذاری اشیا مجازی) از بینایی کامپیوتر استفاده میشود.
رباتیک (Robotics)
رباتیک شاخهای میانرشتهای است که به طراحی، ساخت و بهکارگیری رباتها میپردازد و با هوش مصنوعی نیز تلاقی دارد. در زمینۀ رباتیکِ هوشمند، هدف آن است که رباتها بتوانند وظایف خود را بهصورت خودمختار و بدون دخالت مستقیم انسان انجام دهند. برای این منظور، از الگوریتمهای هوش مصنوعی (مانند یادگیری ماشین و بینایی کامپیوتر) در رباتها استفاده میشود تا آنها بتوانند محیط خود را درک کنند (از طریق حسگرها و دوربینها)، تصمیمگیری کنند و عمل مناسب انجام دهند. بهعنوانمثال، یک ربات صنعتی در کارخانه میتواند با دیدن قطعات و موقعیت آنها (از طریق بینایی کامپیوتر) تصمیم بگیرد که چگونه بازوی مکانیکی خود را حرکت دهد تا قطعهای را بردارد و در جای مناسب قرار دهد. یا یک ربات خانگی (مثل جاروبرقی هوشمند) محیط اتاق را اسکن کرده و مسیر بهینه برای تمیز کردن را پیدا میکند. در عرصهٔ کاوش نیز رباتهای هوشمندی مانند مریخنوردها با بهرهگیری از هوش مصنوعی ناوبری و کاوش در سیارات دیگر را انجام میدهند. رباتیک هوشمند به دنبال ساخت ماشینهایی است که بتوانند وظایف پیچیده را با دقت و سرعت بالا انجام دهند و در صورت تغییر شرایط، واکنش مناسب نشان دهند.
سیستمهای خبره (Expert Systems)
سیستمهای خبره یکی از نخستین نمونههای کاربردی هوش مصنوعی بودند که در دهههای ۱۹۷۰ و ۱۹۸۰ توسعه یافتند. این سیستمها برای انجام وظایف مشابه با متخصصان انسانی در حوزههای مختلف (مانند پزشکی، زمینشناسی، و مشاورهٔ مالی) طراحی شده بودند. سیستمهای خبره عموماً شامل دو بخش اصلی بودند:
- پایگاه دانش: مجموعهای از قوانین و اطلاعات تخصصی، که میتوانست از منابع مختلف از جمله متخصصان انسانی و دادههای تاریخی استخراج شود.
- موتور استدلال: مکانیزمی که از قوانین و اطلاعات برای استنتاج نتایج و پاسخگویی به پرسشها استفاده میکرد.
یکی از معروفترین نمونههای این سیستمها MYCIN بود که برای تشخیص بیماریهای خونی و تجویز آنتیبیوتیک توسعه یافت. این سیستم میتوانست بر اساس علائم بیمار و نتایج آزمایشگاهی، پیشنهادهایی ارائه دهد.
در ابتدا، سیستمهای خبره بیشتر بر پایهٔ قوانین صریح (اگر-آنگاه) کار میکردند، اما در طول زمان با یادگیری ماشین و روشهای دادهمحور ترکیب شدند. امروزه برخی از سیستمهای خبره از روشهای یادگیری خودکار استفاده میکنند تا بهمرور زمان دانش خود را بهبود ببخشند. برای مثال، برخی از سیستمهای پزشکی مدرن میتوانند هم از پایگاه دانش قوانین پزشکی و هم از تحلیل دادههای بیماران قبلی برای ارائهٔ تشخیص بهتر بهره بگیرند.
بنابراین، برخلاف تصور اولیه، سیستمهای خبره لزوماً فقط دانش متخصصان را بهصورت ایستا ذخیره نمیکردند، بلکه در برخی از نسخههای مدرن آنها، از روشهای یادگیری و تحلیل داده نیز استفاده میشود. امروز، بسیاری از سیستمهای پشتیبان تصمیمگیری (Decision Support Systems) نوعی سیستم خبره مدرن محسوب میشوند که میتوانند از قوانین صریح و یادگیری ماشین برای تحلیل دادهها و ارائهٔ پیشنهادات استفاده کنند.
منطق فازی (Fuzzy Logic)
منطق فازی یک رویکرد منطقی و محاسباتی است که امکان کار با مفاهیم غیر دقیق و پیوستار را فراهم میکند. بر خلاف منطق کلاسیک که در آن گزارهها فقط میتوانند کاملاً درست یا کاملاً نادرست باشند (صفر یا یک)، در منطق فازی درجههایی از درستی تعریف میشود. برای مثال، در منطق فازی میتوان گفت «هوا تا حدی گرم است» و این عبارت را به یک مقدار عددی بین ۰ و ۱ نگاشت کرد که بیانگر درجهٔ گرمی هوا باشد. به این ترتیب منطق فازی کمک میکند تا عدم قطعیت و مفاهیم مبهم را به شکلی منعطفتر مدلسازی کنیم.
در هوش مصنوعی و مهندسی کنترل، منطق فازی کاربردهای فراوانی دارد. بسیاری از سیستمهای کنترلی خودکار (مانند ترموستاتهای هوشمند، دوربینهای دیجیتال یا ماشینهای لباسشویی پیشرفته) از منطق فازی بهره میبرند. این سیستمها بهجای قوانین سختِ صفر و یکی، از قواعد فازی استفاده میکنند تا بر اساس ورودیهای مبهم یا متغیر تصمیمگیری نرمتری داشته باشند. برای مثال، یک ماشین لباسشویی هوشمند میتواند با استفاده از منطق فازی تشخیص دهد که لباسها «تا حدودی تمیز» شدهاند و مدت شستوشو را بر همان اساس تنظیم کند. در زمینهٔ هوش مصنوعی نیز منطق فازی برای استدلال در شرایط عدم قطعیت و ترکیب با سیستمهای خبره یا شبکههای عصبی به کار میرود تا سیستمها رفتارهایی انسانیتر و منعطفتر داشته باشند.
الگوریتم ژنتیکی (Genetic Algorithm)
الگوریتم ژنتیکی یک روش بهینهسازی در هوش مصنوعی است که از نظریهٔ تکامل ژنتیکی الهام گرفته شده است. ایدهٔ اصلی این الگوریتم شبیه به فرایند انتخاب طبیعی در زیستشناسی است؛ به این صورت که برای یک مسئله، ابتدا مجموعهای از جوابهای حدسی (جمعیتی از راهحلها) به طور تصادفی ایجاد میشود. سپس این جوابها ارزیابی میشوند و بر اساس میزان مطلوبیت یا شایستگی (fitness) هر کدام، تعدادی از جوابهای بهتر انتخاب شده و با یکدیگر ترکیب (تولید نسل جدید) میشوند یا دچار جهش (تغییرات تصادفی) میگردند. نسل جدید دوباره ارزیابی شده و این فرایند انتخاب و ترکیب و جهش بارها تکرار میشود. در نهایت، پس از چندین نسل، جوابهایی تکامل مییابند که بهینهتر و کارآمدتر هستند.
الگوریتمهای ژنتیکی برای حل مسائلی به کار میروند که فضای جستجوی بسیار بزرگی دارند یا یافتن راهحل بهینه با روشهای معمول دشوار است. بهعنواننمونه، در مسئلهٔ زمانبندی (مثلاً زمانبندی کارها در یک کارخانه یا زمانبندی پروازها) میتوان از الگوریتم ژنتیکی استفاده کرد تا ترکیب مناسبی از برنامهها را پیدا کند. یا در بهینهسازی طراحی یک مدار الکترونیکی، این الگوریتم میتواند به تدریج طرحهایی را تولید کند که عملکرد بهتری دارند. هرچند الگوریتم ژنتیکی تضمین نمیکند همیشه بهترین جواب ممکن را پیدا کند، اما در عمل اغلب به راهحلهای نزدیک به بهینه میرسد و بهویژه وقتی دانش مستقیمی دربارهٔ ساختار جواب بهینه نداریم، روش مفیدی به شمار میآید.
هوش مصنوعی عمومی (Artificial General Intelligence – AGI)
هوش مصنوعی عمومی که به اختصار AGI نامیده میشود، به نوعی فرضی و آرمانی از هوش مصنوعی اشاره دارد که میتواند در هر زمینهٔ فکری و شناختی به توانمندیهای در سطح انسان یا حتی فراتر دست یابد. یک AGI قادر خواهد بود طیف گستردهای از وظایف مختلف را انجام دهد و از دانشی که در یک زمینه آموخته در زمینههای دیگر نیز استفاده کند؛ درست مانند یک انسان که میتواند دانش و تجربهاش را در مسائل متنوع به کار ببرد. این مفهوم در تقابل با هوش مصنوعی محدود یا هوش مصنوعی ضعیف قرار میگیرد که به سیستمهای امروزی گفته میشود و تنها در حوزههای خاصی مهارت دارند (مثلاً یک هوش مصنوعی ممکن است فقط در بازی شطرنج بسیار خوب باشد یا فقط در تشخیص چهره عمل کند).
دستیابی به هوش مصنوعی عمومی یکی از اهداف نهایی و درعینحال چالشبرانگیز دنیای هوش مصنوعی است. چنین سیستمی نیازمند درک و هوشی چندمنظوره در حد انسان، خلاقیت، توانایی حل مسئله در شرایط نو و شاید حتی آگاهی است. هنوز هیچ نمونهٔ واقعی از AGI وجود ندارد و پژوهشگران نمیدانند دقیقاً چه زمانی (و آیا اصلاً) به آن دست خواهیم یافت. علاوه بر چالشهای فنی، ظهور احتمالی هوش مصنوعی عمومی مباحث اخلاقی و اجتماعی عمیقی را نیز مطرح میکند، چراکه یک ماشین فوقهوشمند میتواند تأثیرات گستردهای بر جامعهٔ بشری داشته باشد. مفهوم هوش مصنوعی عمومی گاه با اصطلاحی تحت عنوان «هوش مصنوعی قوی» نیز بیان میشود.
تشخیص گفتار (Speech Recognition)
تشخیص گفتار فناوریای در حوزهٔ هوش مصنوعی و پردازش زبان است که به کامپیوتر امکان میدهد گفتار انسان را تشخیص داده و به متن یا فرمان قابل فهم تبدیل کند. در این روش از مدلهای یادگیری ماشین و بهویژه شبکههای عصبی عمیق استفاده میشود تا الگوهای صوتی گفتار انسان شناسایی شوند و با کلمات مربوطه تطبیق داده شوند. سیستمهای تشخیص گفتار امروزی میتوانند گفتار پیوستهٔ انسان را با دقت نسبتاً بالایی تبدیل به متن کنند؛ نمونههای رایج آن تبدیل گفتار به پیام متنی در تلفنهای همراه، زیرنویس خودکار ویدیوها، یا تایپ گفتاری در رایانه است. همچنین دستیارهای صوتی مانند گوگلاسیستنت، سیری و الکسا از فناوری تشخیص گفتار بهره میبرند تا فرامین صوتی کاربر را درک کرده و به آنها پاسخ دهند. با وجود پیشرفتهای زیاد، تشخیص گفتار همچنان با چالشهایی مواجه است؛ برای مثال لهجههای مختلف، نویز پسزمینه یا صحبت چند نفر به طور همزمان میتواند بر دقت این سیستمها تأثیر بگذارد.