آیا مدل های زبانی می توانند به هوش عمومی نزدیک شوند؟ آنالیز محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی

به گزارش مجله آرنا، در یک عصر پاییزی، زمانی که خبرهای مربوط به هوش مصنوعی با سرعتی سرسام آور در شبکه ها منتشر می شد، چند دوست قدیمی در کافه ای نشسته بودند و درباره آینده بحث می کردند. یکی از آنها با شوق گفت که شاید تا دو سال دیگر ماشین هایی بسازیم که ذهنی شبیه ما داشته باشند. دیگری با تردید سر تکان داد و گفت که این وعده ها بزرگ اند اما هیچ کس علت واقعی برای عملی شدن واقعی آنها نداده. در همین میان گوشی من لرزید و پیامی درباره پیش بینی تازه ای از یک مدیر فناوری درباره ظهور هوش فرا انسانی آمد. همین لحظه به این فکر کردم که آیا این هیجان جمعی ریشه ای واقعی دارد یا تنها حاصل برداشت های سطحی از توان مدل های زبانی است.

آیا مدل های زبانی می توانند به هوش عمومی نزدیک شوند؟ آنالیز محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی

اما واقعا محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی چیست؟

مدل های زبانی و فاصلهٔ آنها با هوش انسانی

مدیران شرکت های بزرگ فناوری تصویری ارائه می نمایند که بر اساس آن رسیدن به هوش فرا انسانی یک قدم کوچک به جای مانده است. از دید آنها مدل های زبانی بزرگ یا همان LLMها با افزایش مقیاس و قدرت پردازشی می توانند از مرزهای شناختی ما عبور نمایند. اما تحلیل علمی موضوع نشان می دهد این ادعا هم راستا با محدودیت های بنیادی این مدل ها نیست. این مدل ها اساساً بر روی حجم عظیمی از داده های متنی آموزش می بینند و خروجی را بر پایهٔ پیش بینی توالی توکن ها فراوری می نمایند. این روند هرچند پیچیده است اما از منظر شناختی تنها شکلی از مدل سازی زبانی به شمار می رود. در برابر آن فکر انسان شبکه ای از سامانه های ادراکی، حافظهٔ سِیال، استدلال فضایی، قضاوت، نظریهٔ ذِهن و توانایی های سنجشی متعددی دارد که هیچ کدام به صورت مستقیم از زبان منشا نمی گیرند.

وقتی مدیران فناوری هوش عمومی مصنوعی را تنها با توسعهٔ مدل های زبانی هم معنی می نمایند، شکاف میان ادعا و واقعیت بیشتر آشکار می گردد. زیرا حتی اگر مدل های زبانی در نگارش یا پاسخ دهی عملکردی شگفت آور داشته باشند، این مهارت ها تنها بازتاب توانایی آنها در بازفراوری الگوهای زبانی است نه آفرینش مفاهیم نوین. همین نکته نقطهٔ مرکزی محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی است. فکر انسان توانایی آزمایش کردن، ساختن فرضیه، نقض باورهای خود و شکل دهی نظریه های تازه دربارهٔ دنیا را دارد. مدل زبانی نه دنیا را تجربه می نماید و نه اشیای فیزیکی را دستکاری می نماید و نه از آزمون و خطا برایشان معنا دارد.

رابطهٔ زبان و تفکر از نگاه علوم اعصاب

نویسنده مقاله اصلی -Benjamin Riley- شرح می دهد که علم عصب شناسی در دو دههٔ اخیر روشن نموده است که زبان و تفکر سامانه هایی جداگانه در مغز هستند. اسکن های fMRI نشان داده اند که فعالیت نورونی هنگام حل مسئلهٔ ریاضی، پردازش روابط عِلّی یا فهم فکر دیگران در شبکه هایی متفاوت با شبکهٔ زبانی رخ می دهد. این یافته ها به شکل مستقیم ادعای بعضی مدیران فناوری را که زبان را بستر اصلی تفکر معرفی می نمایند رد می نماید.

بچه هایی که هنوز زبان را نیاموخته اند اما استدلال می نمایند، کنجکاو می شوند، قوانین سادهٔ فیزیک را کشف می نمایند و روابط علت و معلول را می فهمند. این واقعیت نشان می دهد که زبان ابزار ارتباط است نه منبع تفکر. حتی کسانی که بر اثر آسیب مغزی زبان خود را از دست می دهند، می توانند از عهدهٔ بسیاری از کارنمودهای شناختی برآیند. همین حقایق علمی پایهٔ مهمی برای بحث محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی فراهم می نماید.

انسان ها زبان را برای انتقال محتوا، اشاره به اشیای دنیا، تفسیر تجربه و انتقال دانش به نسل های بعدی به کار می برند. مدل زبانی تنها ساختار بیرونی همین زبان را تقلید می نماید بدون آنکه تجربه ای پشت آن باشد. این تفاوت ساختاری باعث می گردد حتی مدل های بسیار بزرگ همچنان در مرز ارتباط زبانی بمانند و به سطح تفکر خودبنیاد نرسند.

زبان به عنوان ابزار انتقال معرفت نه شکل دهندهٔ آن

پژوهشگران برجسته مانند Evelina Fedorenko و Edward Gibson نشان داده اند که زبان به علت هزینهٔ شناختی پایین و کارآمدی بالای آن به عنوان ابزار انتقال اندیشه تکامل یافته است. زبان کُد کارآمدی است که امکان اشتراک معنا بین انسان ها را فراهم می نماید. همین ویژگی موجب شده زبان به صورت فرهنگی از نسلی به نسل بعد منتقل گردد و ظرفیت شناختی ما را تقویت کند. اما زبان خود منبع تفکر نیست.

نویسنده در ادامه اشاره می نماید که این واقعیت در تضاد با فرضیهٔ صنعت هوش مصنوعی است. صنعت گمان می نماید که مدل سازی گستردهٔ زبان می تواند به شکل اتوماتیک به مدل سازی تفکر منجر گردد. اما شناخت انسانی شبکه ای از توانایی ها است که هر یک نیازمند تعامل با دنیا، دریافت بازخورد، درک زمان، استفاده از حافظهٔ فعال و شکل دهی دانش سازه ای هستند. هیچ یک از این سازه ها در مدل زبانی وجود ندارد.

این بخش از مقاله به شکلی روشن نشان می دهد که چرا توسعه مجموعه داده ها یا افزایش قدرت پردازشی سرورها تبدیل به هوش عمومی نمی گردد. از آنجا که مدل های زبانی تنها لایهٔ ظاهری زبان را تقلید می نمایند، توانایی عبور از مرزهای دادهٔ ورودی را ندارند و نمی توانند نارضایتی فعال از الگوهای موجود و فراوری الگوهای تازه را تجربه نمایند. انسان ها مدل های فکری خود را اصلاح می نمایند و به ساحت های تازه معنا می رسند. مدل ها تنها تکثیرنمایندهٔ الگوهای موجودند.

بحران اتکا به مقیاس و نقش نقدهای درون صنعت

در بخش دیگری از مقاله، نویسنده به موجی از انتقادها داخل خود صنعت اشاره می نماید. بعضی پژوهشگران مانند Yann LeCun که جایزهٔ تورینگ گرفته اند، به صراحت گفته اند که مدل های زبانی هرچقدر بزرگ شوند نمی توانند دنیا را بفهمند، عمل محور نیستند و حافظهٔ پایدار ندارند. LeCun مفهوم مدل های دنیا را مطرح نموده است که سامانه هایی هستند با قابلیت درک ساختارهای فیزیکی، حافظهٔ بلندمدت و توانایی طرح ریزی کنش ها. این رویکرد نشان می دهد که بخشی از صنعت نیز به محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی مطلع شده است.

نویسنده سپس به دیدگاه گروهی از دانشمندان اشاره می نماید که تعریفی تازه از هوش عمومی مصنوعی ارائه نموده اند. آنها هوش عمومی را تنها با توانایی پاسخ گویی زبانی نمی سنجند، بلکه ترکیبی از شاخص هایی مانند حافظهٔ فعال، استدلال عِلّی، سرعت پردازش، دانش چندبُعدی، بینایی، شنوایی و توانایی بازیابی حافظه را در نظر می گیرند. این تعریف تازه رویکرد تک عاملی را کنار می گذارد و هوش را شبکه ای از توانایی ها می داند.

اما نویسنده هشدار می دهد که حتی این مدل چندمحوری نیز راهی مستقیم به سوی هوش انسانی ارائه نمی دهد. زیرا تعریف وزن نسبی هر توانایی، مشخص نحوهٔ ترکیب آنها و تبدیل این مجموعه به چیزی شبیه به فکر انسان کاری بسیار پیچیده است. حتی اگر بتوانیم این قابلیت ها را در یک سامانه جمع کنیم، هنوز نمی دانیم آیا این ترکیب کافی است تا سامانه بتواند از مرز اعتماد به داده ها عبور نموده و خلاقیت پارادایمی ایجاد کند.

جایگاه نارضایتی شناختی در نوآوری علمی و جایی که مدل های زبانی کم می آورند

نویسنده در بخش پایانی مقاله به مفهوم تغییر پارادایم از نگاه توماس کوهن اشاره می نماید. او می گوید بخش بزرگی از پیشرفت های علمی زمانی رخ می دهد که پژوهشگران از چارچوب های موجود ناراضی می شوند و پرسش هایی طرح می نمایند که در فضای قبلی قابل پاسخ نبودند. این شرایط با نوعی نارضایتی ذِهنی همراه است که انسان را به سمت شکستن محدودیت های فکری می برد.

در اینجا نویسنده استدلال می نماید که مدل های زبانی چنین نارضایتی ای را تجربه نمی نمایند. این مدل ها مجموعه ای از الگوهای آماری هستند که بر اساس داده های ورودی رفتار می نمایند. آنها نمی توانند به این نتیجه برسند که داده های موجود برای فهم دنیا کافی نیست و باید مسیر تازه ای اختراع نمایند. حتی اگر بتوانند ترکیب های تازه بسازند، همچنان در فضای معناهای پیشینی گرفتار می مانند و در دایرهٔ آنچه قبلاً ثبت شده دور می زنند. این همان هستهٔ مرکزی محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی است.

از نگاه نویسنده، ماشین ها می توانند داده ها را بازآرایی نمایند اما نمی توانند نارضایتی معرفتی داشته باشند. آنچه دانشمندان را قادر ساخته نظریه هایی مانند نسبیت یا مکانیک کوانتومی را بسازند، نه صرف ترکیب داده ها بلکه عبور از داده ها بوده است. این حرکت جهشی نیازمند تجربهٔ ذِهنی، شهود، ناراحتی از ناکامی های مدل قبلی و پذیرش ریسک فکری است. مدل زبانی نه شهود دارد نه تجربه و نه ریسک می نماید. همین موضوع باعث می گردد حتی اگر به برترین شکل کار کند، بیشتر شبیه سامانه ای از استعاره های مرده باشد که تنها معناهای موجود را بازنویسی می نماید.

خلاصهٔ نهایی

مدل های زبانی بزرگ ابزارهایی هستند که ساختار زبان را تقلید می نمایند اما توانایی ساخت معنا یا نظریه ندارند. پژوهش های علوم اعصاب نشان می دهد تفکر انسان بر پایهٔ شبکه هایی غیرزبانی شکل می گیرد که در مدل های زبانی وجود ندارد. ادعای رسیدن به هوش عمومی مصنوعی تنها با افزایش مقیاس مدل ها پشتوانهٔ علمی ندارد. به همین علت محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی مسئله ای اساسی در فهم آیندهٔ سامانه های هوش مصنوعی است.

منبع

❓ پرسش های رایج

1. آیا مدل های زبانی می توانند بدون زبان به سطحی از هوش واقعی برسند؟

خیر، زیرا ساخت آنها کاملاً مبتنی بر زبان است و اگر زبان را حذف کنیم چیزی از مدل باقی نمی ماند. فکر انسان شبکه ای چندبُعدی دارد اما مدل زبانی تنها یک بُعد را بازسازی می نماید.

2. چرا علوم اعصاب نقش زبان را در تفکر کم رنگ می داند؟

اسکن های fMRI نشان می دهد شبکه های حل مسئله، استدلال عِلّی و نظریهٔ ذِهن مستقل از شبکهٔ زبانی فعال می شوند. این پدیده نشان می دهد زبان ابزار انتقال است نه منبع تفکر.

3. آیا افزایش مقیاس مدل ها می تواند محدودیت ها را برطرف کند؟

افزایش مقیاس خروجی ها را روان تر می نماید اما توانایی مدل برای ساخت تجربه، ادراک یا نارضایتی شناختی را افزایش نمی دهد. بنابراین نقش آن در رسیدن به هوش عمومی بسیار محدود است.

4. مدل های دنیا چه تفاوتی با مدل های زبانی دارند؟

مدل های دنیا از ساختارهای ادراکی، حافظهٔ پایدار و توانایی طرح ریزی کنش ها استفاده می نمایند. همین ویژگی ها آنها را به سوی شناخت عمل محور نزدیک می نماید که در مدل های زبانی وجود ندارد.

5. چرا نویسنده از استعارهٔ استعاره های مرده استفاده می نماید؟

زیرا مدل های زبانی تنها الگوهای موجود را بازآرایی می نمایند و نمی توانند از چارچوب داده های ورودی عبور نمایند. آنها چیزی نو نمی آفرینند و در محدودهٔ معناهای گذشته می مانند.

دکتر علیرضا مجیدی

پزشک، نویسنده و بنیان گذار وبلاگ مجله آرنا

دکتر علیرضا مجیدی، نویسنده و بنیان گذار وبلاگ مجله آرنا .

با بیش از 20 سال نویسندگی ترکیبی مستمر در زمینهٔ پزشکی، فناوری، سینما، کتاب و فرهنگ.

باشد که با هم متفاوت بیاندیشیم!

دربارهٔ علیرضا مجیدی در مجله آرنا

مطالب مرتبط

آیا هوش مصنوعی هم دچار استرس می گردد؟ آنالیز پدیدهٔ اضطراب دیجیتال در مدل های زبانی

آیا حباب هوش مصنوعی در آستانه ترکیدن است؟ نگاهی واقع بینانه به مدل های زبانی بزرگ

آیا هوش مصنوعی با بلعیدن کتاب ها آینده دانش بشری را تغییر می دهد؟ | تحلیل حقوقی و فلسفی استفاده…

مدل های هوش مصنوعی در صنعت مد؛ آیا آیندهٔ تشریات مد مانند ووگ دیگر مدل های انسانی نیست؟

هوش مصنوعی هم پیر می گردد؟ زوال شناختی در مدل های زبانی بزرگ

هوش مصنوعی چینی DeepSeek: هوش مصنوعی متن باز که بازی هوش مصنوعی را تغییر می دهد - اما بی جهت هیجان زده…

منبع: یک پزشک
انتشار: 5 آذر 1404 بروزرسانی: 5 آذر 1404 گردآورنده: genarena.ir شناسه مطلب: 2372

به "آیا مدل های زبانی می توانند به هوش عمومی نزدیک شوند؟ آنالیز محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "آیا مدل های زبانی می توانند به هوش عمومی نزدیک شوند؟ آنالیز محدودیت های مدل های زبانی در رسیدن به هوش عمومی مصنوعی"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید