در سال 2023، کاملاً واضح است که مدلهای زبان بزرگ (LLM) در مسیر تبدیل شدن به ابزارهای ضروری سازمانی قرار دارند. مایکروسافت میلیاردها دلار در مشارکت خود با OpenAI سرمایه گذاری می کند تا از پتانسیل LMM های شاخص مانند GPT-4 سرمایه گذاری کند. و این واقعیت که برخی از مدیران صنعت اصرار به توقف شش ماهه هوش مصنوعی دارند، نور روشنی را بر سرعت اختلال در طیف وسیعی از مشاغل، از مدیران گرفته تا مدل ها می تاباند. افزودن به این تغییر، استفاده جالب از LLM به عنوان شخصیت های سیلیکونی است که در یک مقاله تحقیقاتی که بی سر و صدا در سرور preprint arXiv در سپتامبر 2022 ظاهر شد، نشان داده شد.
این مطالعه با نام «از یک، بسیاری: استفاده از مدلهای زبانی برای شبیهسازی نمونههای انسانی»، ماه گذشته به طور رسمی در مجله تحلیل سیاسی منتشر شد. اما فریب عنوان مجله را نخورید. کار این گروه میتواند روشی را که طراحان محصول و بازاریابان دیجیتالی ایدههای خود را آزمایش میکنند و بینش مشتریان بالقوه را جمعآوری میکنند، بهطور اساسی تغییر دهد.
تیم تحقیقاتی که شامل نویسنده مسئول لیزا پی آرگیل است، در دپارتمانهای کامپیوتر و علوم سیاسی در دانشگاه بریگام یانگ در ایالات متحده مستقر است. و با درک اینکه توجه کمی به کاربردهای احتمالی LLM برای پیشبرد درک رفتار اجتماعی و سیاسی انسان شده است، گروه راهی برای استفاده از مدلها – در این مورد، GPT-3 – به عنوان جایگزین برای پاسخدهندگان انسانی ارائه کرد. در انواع وظایف علوم اجتماعی
شخصیت های سیلیکونی چیست؟
آرگیل و همکارانش این جانشینها، سوژههای سیلیکونی و این شخصیتهای سیلیکونی را – که میتوانستند برای نشان دادن انواع کاربران ایجاد شوند – بهطور باورنکردنی واقعی هستند. در این مطالعه، محققان GPT-3 را با پیشینههای اجتماعی و جمعیتشناختی جمعآوریشده از دادههای نظرسنجی انتخابات ایالات متحده در سالهای 2012، 2016 و 2020 مشروط کردند و بررسی کردند که آیا میتوانند از سوژههای سیلیکونی خود برای تعیین نتیجه انتخابات استفاده کنند یا خیر.
همبستگی بین موضوعات سیلیکونی و دادههای واقعی رأیدهندگان بهطور باورنکردنی قوی بود و انسانها و شخصیتها بهطور قابلتوجهی همسو بودند. و نتیجه نشان میدهد که GPT-3 به اندازه کافی تعصبات و ترجیحات ظریفی را نشان میدهد تا – در این مورد – تعیین کند که بر اساس داستان هر یک از شخصیتهای سیلیکونی به کدام حزب رأی خواهد داد.
آنچه در مورد یافته ها قابل توجه است این است که چگونه LLM ها خارج از محدودیت های زمانی خود هستند. محققان در مقاله خود توضیح دادند: “مجموعه آموزشی برای GPT-3 در سال 2019 به پایان رسید، بنابراین داده های سال 2020 به ما اجازه می دهد تا بررسی کنیم که چگونه وفاداری الگوریتمی مدل زبان در زمانی که خارج از زمان مجموعه آموزشی اصلی بررسی می شود، تغییر می کند.”
تداوم سوگیریها در مدل به این معنی است که GPT-3 میتواند برای فراخوانی نتیجه انتخابات ایالات متحده در سال 2020 استفاده شود، زمانی که سوژههای سیلیکونی مشروط به داستانهای پسزمینهای شبیه انسان ارائه شود، حتی اگر فاقد دادههای آموزشی از آن دوره زمانی باشد. . و اگر به این فکر می کنید که جهش از موضوعات سیلیکونی به شخصیت های سیلیکونی – که نماینده نه رای دهندگان، بلکه مشتریان هستند – می تواند آزمایش محصول و طلای بازاریابی دیجیتال باشد، ممکن است حق با شما باشد.
از سیناپس های دیجیتال تا بازاریابی دیجیتال
اما قبل از اینکه بخواهیم به چیزهای بزرگ بعدی در بازاریابی دیجیتال و تست محصول بپردازیم، اجازه دهید نگاهی گذرا به زیر سرپوش GPT-3 بیندازیم. پیشرفت LLM OpenAI (که توسعه یافته و به عنوان مبنایی برای ChatGPT بسیار محبوب ساخته شد) دارای 175 میلیارد پارامتر است که 10 برابر بیشتر از هر LLM قبلی است. پارامترها وزنها را در هر گره در شبکه عصبی چند لایه نشان میدهند و تعیین میکنند که کدام یک از این سیناپسهای دیجیتال زمانی که GPT-3 با یک پیام متنی ارائه میشود و تلاش میکند کلمه بعدی را در دنباله حدس بزند، آتش میگیرند.
در اصل، هر چه پارامترها بیشتر باشد، مدل هوش مصنوعی توانایی بیشتری دارد. اما همه این میلیاردها پارامتر نیاز به آموزش دارند و این امر توسعه دهندگان را متعهد به استفاده از حجم وسیعی از داده ها می کند. در ابتدا، پارامترها دارای مقادیر تصادفی هستند، اما به مرور زمان، در طول آموزش (که ماه ها طول کشید، با استفاده از یک ابررایانه سفارشی طراحی شده در Microsoft Azure) به مقادیر بهینه خود همگرا می شوند.
بسیاری از مقالات خبری ادعا میکنند که GPT-3 یک جعبه سیاه است، اما وقتی منابع دادههای آموزشی را در نظر میگیرید، میتوانید متوجه شوید که چگونه LLM ها دنیا را درک میکنند. و برخلاف برخی گزارشها، OpenAI جزئیاتی را در مورد مجموعه دادههای آموزشی که استفاده میکند به اشتراک گذاشته است. منابع آموزشی شامل ویکیپدیا، دو مجموعه کتاب مبتنی بر اینترنت (معادل بیش از 13 میلیارد کلمه)، صفحات وب توصیهشده توسط صفحات دارای رأی مثبت Reddit، و نسخه فیلتر شده و حذفشده Common Crawl – منبعی عظیم حاوی پتابایت دادههای جمعآوریشده از سالها وب است. خزیدن
بنابراین این برای تست محصول و بازاریابی دیجیتال چه معنایی دارد؟ بازاریابان دیجیتال به سرعت متوجه شده اند که ChatGPT برای تولید سریع کپی و استفاده از سبک های مختلف نوشتاری مفید است – به عنوان مثال، برای ایجاد پست های رسانه های اجتماعی یا سایر دارایی های بازاریابی. اما همانطور که گفته شد، شخصیتهای سیلیکونی راه را برای چیزهای بیشتری باز میکنند. و داده های مصنوعی آنها می تواند در انواع سناریوهای آزمایش کاربر استفاده شود.
بینش مشتری و هوشمندی تست محصول
برای اینکه ایده ای به شما بدهیم، یک آزمایش فوق العاده سریع با استفاده از رابط کاربری وب ChatGPT OpenAI انجام دادیم که ربات چت پیشرفته را با موارد زیر تغذیه می کند:
Persona 1 = مرد میانسالی که به ورزش علاقه دارد و عضو باشگاه است.
و سپس از ChatGPT بخواهید لیستی از محصولاتی را که شخصیت 1 را هدف قرار می دهند توصیه کند، که دنباله پیشنهادات زیر را ایجاد کرد.
ردیاب تناسب اندام یا ساعت هوشمند، کفش های ورزشی، نوارهای مقاومتی، فوم غلتکی یا توپ ماساژ، لباس های ورزشی، مکمل های پروتئینی، بطری آب و کیف بدنسازی.
اما سرگرمی به همین جا ختم نمی شود. به عنوان مثال، می توانید به ChatGPT بگویید که سال 1950 است و از چت بات پیشرفته بخواهید لیستی را که اکنون شامل:
دمبل یا هالتر، کفش ورزشی، دستکش بوکس، طناب پرش، دوچرخه ثابت، ساپورت ورزشی، عرق گیر و کمربند وزنه برداری.
در حال حاضر، ما بینش مفیدی در مورد روند خط تولید امروز در مقایسه با دهه 1950 داریم. اما این فقط خراش دادن سطح است. شما می توانید با شخصیت های سیلیکونی خیلی پیش بروید. اما لازم نیست این آزمایش محصول و چشم انداز بازاریابی دیجیتال را به تنهایی بررسی کنید. Kwame Ferreira، Hugo Alves و همکارانشان شروع به آزمایش با هوش مصنوعی به عنوان راهی برای ترکیب کاربران مجازی برای حل یکی از بزرگترین مشکلات آنها – آزمایش محصول – کردند. و نه تنها داده های مصنوعی به خوبی کار می کردند، بلکه در جاهای دیگر نیز کمک کردند. تیمی که این فرآیند را به عنوان یک نسخه بتا با نام «کاربران مصنوعی» باز کرده است، میگوید: «همانطور که آزمایشهای خود را در هوش مصنوعی تکامل دادیم، واضحتر شد که در مرحله کشف محصول ارزش زیادی کسب میکنیم».
اگر پیشینه های دقیقی برای مشتریان و مشتریان خود دارید، این احتمال وجود دارد که بتوانید شخصیت های سیلیکونی مبتنی بر LLM را برای ارائه داده های تست کاربر یا بینش بازاریابی که در غیر این صورت ساعت ها، روزها یا حتی هفته ها طول می کشید، به کار ببندید. برای جمع آوری و نه تنها می توانید در زمان تحقیق محصول خود صرفه جویی کنید، بلکه احتمالاً در هزینه نیز صرفه جویی خواهید کرد.