پس از راه اندازی ChatGPT در ماه نوامبر، شرکت های بزرگ مجذوب ایده ساخت هوش مصنوعی در سیستم های خود شده اند. مایکروسافت و گوگل با اعلام حرکت خود برای ساخت مدل هایی مانند GPT-3 و Bard در موتورهای جستجوی خود، این مسئولیت را رهبری کرده اند، که امکان ارائه پاسخ های متنی و انسانی به پرس و جوها را فراهم می کند.
شرکتهای بیشتری احتمالاً این راه را دنبال خواهند کرد و مدلهای زبان بزرگ (LLM) را در موتورهای جستجو پیادهسازی میکنند. این مدلها، که شامل GPT-3 در میان رتبههایشان میشود، با توانایی خود در تقلید و تفسیر الگوهای گفتار و نوشتار انسان، بسیاری از دنیای فناوری را مجذوب خود کردهاند.
LLM ها که بر روی حجم وسیعی از داده های منبع اینترنت و ردیابی میلیاردها پارامتر آموزش دیده اند، می توانند مسائل ظریف گفتار انسان را درک کنند. بنابراین، LLM ها قادر به تفسیر محاوره ها، زیرمتن ها، و سوالات ظریف هستند و خروجی هایی تولید می کنند که به همان اندازه برای ما غنی به نظر می رسد.
با این حال، در حالی که LLM ها می توانند زبان طبیعی را بفهمند و تولید کنند، به این معنی نیست که آنها به طور طبیعی برای بسیاری از سازمان ها در حال حاضر ارزش ایجاد می کنند. در عوض، اندازه و مقیاس LLM اغلب آنها را برای هر کاری در زمینه هایی که دقت واقعی نگرانی اصلی است، بسیار نامناسب می کند. این شامل بسیاری از سوالات جستجوی آنلاین است.
LLM ها در زمینه هایی که نیاز به دانش تخصصی دارند عملکرد خوبی ندارند. در واقع، آنها در هیچ نقش درآمدزایی که نیاز به قابلیت اطمینان واقعی است، اصلا خوب عمل نمی کنند. چرا این طور است؟ و این چه معنایی برای استفاده از هوش مصنوعی در تجارت دارد؟
LLMs: مشکل مقیاس
ضعف واقعی LLMها به کیفیتی مربوط می شود که به آنها اجازه می دهد گفتار افراد غیر عادی را تفسیر و تقلید کنند: دامنه داده هایی که آنها در مورد آنها آموزش دیده اند.
برای آموزش LLM، تیمهایی در سازمانهایی مانند OpenAI یا Google میلیونها نمونه متن را از سراسر اینترنت باز مینویسند. این ترکیب تقریباً هر نوع محتوای موجود در وب عمومی و تقریباً در هر موضوع قابل تصور را پوشش می دهد. از این رو، LLM ها می توانند ایده ای از زبان مورد استفاده افراد عادی ایجاد کنند.
اما این مشکل زمانی آشکار میشود که وارد یک زمینه خاص شوید. حتی قبل از معرفی اصطلاحات خاص منطقه، متوجه میشویم که تخصصهای مختلف اغلب از تعاریف دقیق و متمایز برای کلمات در مقایسه با استفاده روزمره استفاده میکنند. این فقط شامل تعاریف نیز نمی شود: یک رشته ممکن است روابط بسیار متفاوتی بین مفاهیم و اصطلاحات در مقایسه با همان موارد در رشته دیگر داشته باشد.
در نتیجه، LLMهایی که درخواستهایی در یک زمینه تخصصی ارائه میکنند، اغلب به کاذب آنالوگ از یک حوزه نامرتبط میپردازند، از تعاریف اشتباه هنگام منبعیابی اطلاعات استفاده میکنند، یا به طور کامل سؤالی را که از آن پرسیده میشود به اشتباه درک میکنند.
> همچنین ببینید: آیا ChatGPT کد پایین را منسوخ می کند؟
چرخش به مدل های هوشمندتر برای جستجو
مشکل بزرگ برای LLM ها در جستجو این است که بسیاری از آنها برای هیچ درخواستی برای دانش تخصصی یا تخصصی طراحی نشده اند. بنابراین چه فضایی برای هوش مصنوعی در دنیای جستجو وجود دارد؟
پاسخ در مدل های زبان هوشمند نهفته است. اینها مدلهایی هستند که بر روی مجموعه دادههای باکیفیت بالا و در بالای محتوای علمی آموزش داده شدهاند که از ابتدا بر روی یک زمینه تجاری یا زمینه تخصصی خاص متمرکز شدهاند. علاوه بر این، تمرکز زیادی روی دقت واقعی نتایج تولید شده و استناد به منابع مورد استفاده برای رسیدن به این نتایج وجود دارد.
این مدلهای زبان هوشمند، تضاد قوی با مسائل فعلی با استفاده از LLM برای جستجو ارائه میکنند، جایی که هیچ تضمینی برای صحت واقعی و عدم استناد به منابع وجود ندارد. علاوه بر این، اینترنت با پیوندها، رتبهبندیها و تبلیغات کار میکند، که تحلیلی را که LLM و جستجو به آن وابسته هستند، پیچیدهتر میکند.
LLM ها می توانند از مدل های زبان هوشمند درس های زیادی بیاموزند. با اولویت دادن به توضیح و دقت، توانایی چشمگیر LLM ها می تواند به اختلال در موتورهای جستجوی سنتی تبدیل شود.
ویکتور بوتف CTO در پلتفرم تحقیقاتی مبتنی بر هوش مصنوعی، Iris.ai است
مربوط:
جستجوی مبتنی بر هوش مصنوعی توسط Neeva در اروپا راه اندازی شد – سرویس جستجوی جدید مبتنی بر هوش مصنوعی از فروشنده پلتفرم بدون آگهی Neeva به کاربران اروپایی این امکان را میدهد تا از نتایج جستجو با پشتوانه منابع مرتبط، به دنبال یک خلبان آمریکایی استفاده کنند.
چگونه جستجوی هوش مصنوعی به عنوان یک سرویس بر چالش داده های بدون ساختار غلبه می کند – استارتآپ مدیریت داده Nuclia به سازمانها کمک میکند تا از طریق API موتور جستجوی هوش مصنوعی کمکد خود، ارزش را از دادههای خود دریافت کنند.