من یکی از آن کسانی هستم که اخیراً فناوری های جدید را پذیرفته اند. من یکی از آخرین افرادی بودم که تقریباً در سالهای 2002 تا 2003 برای دریافت تلفن همراه میشناختم. بنابراین، چند ماه منتظر ماندم تا با ChatGPT بازی کنم، زیرا دیگران درباره خوبیهای آن صحبت میکردند. اما همانطور که در مورد کاربردهای بالقوه آن در تحقیقاتم فکر می کردم، فکر کردم شاید جالب باشد که از آن بخواهم یک شبکه را از یک کیفرخواست جنایی کدنویسی کند و آن را با یک شبکه رمزگذاری شده انسانی مقایسه کند. از آنجا میتوانیم تجزیه و تحلیل Quadratic Assignment Procedure (QAP) را اجرا کنیم تا مشخص کنیم این دو شبکه چقدر شبیه هستند. من این فرضیه را مطرح کرده بودم که شباهت بالایی بین CHATGPT و شبکه های کدگذاری شده انسانی پیدا خواهم کرد. شاید چند لبه/پیوند در شبکه بین یکی که توسط هوش مصنوعی قدرتمند Chat GPT و کدگذار انسانی ایجاد شده است، از بین برود.
با این حال، تجربه اخیر من با ChatGPT (17 آوریل 2023) باعث ناراحتی من شد. من مقالات زیادی در مورد افرادی که ChatGPT را برای کارهای ساده ای که قبلاً پیچیده در نظر می گرفتیم استفاده می کنند، خوانده ام. در تحقیقاتم اغلب اسناد دادگاه جنایی مانند کیفرخواستهای در دسترس عموم را میگیرم و آنها را برای شبکههای جنایی کد میکنم.[i] اینها معمولاً شبکههای عملیاتی یا همجرم هستند که از کیفرخواستها یا شکایات جنایی در سوگندنامههایی در حمایت از آن کیفرخواستها به دست میآیند. من تمایل دارم روی پروندههای توطئه گسترده تمرکز کنم زیرا این مکانها مکانهایی هستند که جالبترین شبکهها توسط تحقیقات مجری قانون توسعه مییابند. بنابراین، یکی از بزرگترین وظایف در تحقیق من، ورود/کدگذاری داده است.
ورود داده ها شامل خواندن سند در تعیین ارتباط بین افراد در این پرونده، افراد متهم به جنایت با سایر افراد در شبکه از جمله اقدامات آشکار در حمایت از ادامه شرکت های مجرمانه است. این معمولاً در قالب یک لیست لبه انجام می شود. یک لیست لبه در واقع دو ستون داده است، جفت نام افرادی که به یکدیگر متصل هستند. من و همکارانم اغلب نوع لبهای را که در ستون سوم به هم وصل میکنیم کدگذاری میکنیم. مثلا آیا این یک مکالمه تلفنی است؟ یا این یک ملاقات حضوری بین دو بازیگر است که با هم مرتکب جرم می شوند؟ به طور معمول، ما شبکههای یک حالته (مردم به مردم) را کد میکنیم، اما گاهی اوقات شبکههای دو حالته را کد میکنیم، مانند زمانی که مجرمان در خانههای مخفی یا جلسات شرکت میکنند.[ii] از آنجا ارتباط بین افراد تا جلسات است و ارتباط بین افراد از حضور متقابل آنها در جلسات استنباط می شود. بنابراین، کدگذاری اولیه داده ها مهم است.
من فکر کردم که ChatGPT ممکن است بتواند یک لیست لبه بر اساس کیفرخواست های دادگاه در دسترس عموم ایجاد کند. بنابراین تصمیم گرفتم با یک کیفرخواست اخیراً اعلام شده و کاملاً عمومی کارتل سینالوآ از ناحیه جنوبی نیویورک تلاش کنم.
گفتگوی خود را با ChatGPT با پرسیدن اینکه آیا میداند لیست لبه چیست، شروع کردم. به وضوح انجام داد. این نمونه ای از یک لیست لبه نمونه را ایجاد کرد که در دو ستون با عنوان منبع و هدف در بالا قالب بندی شده بود. این یک قالب رایج برای افرادی است که از یک برنامه تجزیه و تحلیل شبکه اجتماعی منبع باز معروف به Gephi استفاده می کنند. تا اینجای کار خیلی خوبه. نظریه گراف را تشریح کرد که یک رشته ریاضی است که تجزیه و تحلیل شبکه های اجتماعی زیادی از آن استخراج می شود. تا اینجا همه چیز خوبه
وقتی سعی کردم یک کیفرخواست آپلود کنم کمی پیچیده تر شد. این بیشتر تقصیر من بود، تصمیم گرفتم که باید نسخه Adobe خود را به روز کنم و مطمئن شوم که این یک فرمت قابل خواندن است، یعنی یک تصویر نیست بلکه متن قابل خواندن در قالب PDF است. سپس آن را به عنوان یک فایل متنی ذخیره کردم و سعی کردم به سادگی متن را برش داده و در ChatGPT جایگذاری کنم، اما این خیلی بزرگ بود. گزینه هایی برای آپلود متن کیفرخواست به من داد و من تصمیم گرفتم آن را از طریق Google Drive آپلود کنم و پیوند را به اشتراک بگذارم.
من به آن دستورالعمل داده بودم که چگونه می خواهم لیست لبه کدگذاری شود. قوانین ساده بودند: من از کیفرخواست خواستم روابط عملیاتی بین افراد درون شبکه وجود داشته باشد و هیچ ارتباط شنیده ای وجود نداشته باشد. ChatGPT نشان داد که منظور من را فهمیده است. سپس مدتی طول کشید تا یک لیست لبه ایجاد شود.
هنگامی که آن لیست لبه را ایجاد کرد، عجیب به نظر می رسید. این در واقع دو ستون داده بود، ستون اول تقریباً به طور کامل از فرد شماره 1 با سایر افراد متصل به آن تشکیل شده بود. من هیچ راهی برای دانستن اینکه آیا این فقط یک لیست لبه جزئی بود یا نه، ندارم، اما انتظار داشتم که این کیفرخواست عمومی در دسترس کارتل سینالوآ که اخیراً توسط وزارت دادگستری منتشر شده بود، دارای حاشیههای بیشتری باشد.
در 65 صفحه احتمالاً حاوی ارتباطات بیشتری بین بازیگران جنایتکار است. آنچه ایجاد شد یک لیست نسبتا کوچک بود که حداکثر ممکن است چند ده کراوات باشد. اما دادهها عملاً بیفایده بودند، یعنی «فرد یک»، «فرد دو»،… فرد 56، اینها بدون نام افراد یا «برچسبها» در اصطلاح Gephi یا UCINET بیمعنی بودند.[iii]
من از ChatGPT خواستم نام افرادی را که کدگذاری کرده بود به من بگوید و با اطمینان نام افراد موجود در لیست لبه را به من گفت. اما خیلی عجیب به نظر می رسید (می دانم که من یک انسان مزاحم هستم). آنها نام هایی نبودند که انتظار دیدنشان را داشتم.
در واقع، وقتی به عقب برگشتم و کار ChatGPT را بررسی کردم، هیچ یک از نام هایی که از کیفرخواست جنایی به من گزارش کرده بود، در کیفرخواست جنایی وجود نداشت. این برای من تکان دهنده بود. این داده ها چه معنایی داشت؟ از ChatGPT پرسیدم که نامها از کجا آمدهاند، و آن به من گفت که فقط اطلاعاتی را از کیفرخواست جنایی من ارائه کردهام. به نظرم جالب بود با توجه به اینکه هیچ یک از نام ها در آنجا دیده نمی شد.
بنابراین، من یک سوال بعدی پرسیدم و به او توضیح دادم که میدانم هیچیک از نامها وجود ندارد و به من گفت که نامها از مدل زبان آن آمده است. به طور خلاصه، ChatGPT یک لیست لبه بر اساس نامهایی ایجاد کرده بود که کاملاً ساخته شده بودند و در سندی که من ارسال کرده بودم نبود.
تجربه من با ChatGPT به سادگی ساختن چیزها، منحصر به فرد نیست و به طور گسترده توسط دیگران نوشته شده است. اما در خط تحقیق من، درست کردن همه چیز بسیار مهم است.
ChatGPT در آن مرحله به من گفت که برای انجام کاری که واقعاً میخواهم انجام دهد، باید خودم تمام نامهای موجود در کیفرخواست را شناسایی کنم و شناسایی کنم که میخواهم چه کسی وصل شود. این یک ضمیمه نامیده می شود و در تلاش برای خودکارسازی ایجاد شبکه ها با تجزیه و تحلیل خودکار متن استفاده شده است. من به دلایلی که کنی و کولتارت (2015) در تحلیل عالی خود از این روش و نیاز به ارجاع آن به قوم نگاری اشاره کردند، تا حد زیادی نسبت به این روش ها شک دارم.[iv] به عنوان مثال، آنها دریافتند که در این نوع تحقیقات، اسامه بن لادن در شبکههایی که هیچ ارتباطی با آنها ندارد، بسیار محور است، زیرا از او نام برده میشود. آنها برای از بین بردن این پیوندها برای قوم نگاری استدلال می کنند.
در آن مرحله متوجه شدم که سادهتر است که یکی از دانشآموزانم کیفرخواست را بر اساس قوانینی که برای شاگردم توضیح دادهام به جای هر چیزی که ChatGPT ایجاد کند، کد میکند. ممکن است بعداً فهرست گرههای تولید شده توسط انسان را انتخاب کنم و در آینده به CHatGPT راه دیگری بدهم.
همانطور که یکی از قسمت های اخیر جان اولیور توضیح داد، این مشکل جعبه سیاه با هوش مصنوعی است.[v] در مورد اینکه ChatGPT چگونه لیست لبهای را که درخواست کردهام را تولید کرده است، محدود است. آیا منظور من از کلمه فرد را اشتباه متوجه شد؟ آیا منظور من از عملیاتی را اشتباه متوجه شد؟ من کاملاً مایلم که بر اساس فرضیات خود در مورد تعاریف کلمات، اشتباه را در ارائه آموزش بد یا پرسیدن سؤالات نامشخص بپذیرم. اما بهترین چیزی که میتوانم بگویم این است که ChatGPT نامها را کاملاً ساخته است و شبکه زیربنایی نیز احتمالاً تخیلی بوده است.
در واقع، در مکالمه من با ChatGPT به عقب و جلو رفتم که واقعاً اشتباه من در مورد قابلیتهای آن و فرمت آن بود که دادهها را در واقع ارسال کرده بودم. اطلاعات ساختگی
نمیدانم آینده هوش مصنوعی چه خواهد بود، اما در حال حاضر این هوش مصنوعی آماده نیست که به من در تحقیقاتم کمک کند. خوشحالم که اغلب با مجموعه دادههای کوچک قابل مدیریتی کار میکنم که میتوانم آنها را با دست کدنویسی کنم و من، دانشجویانم در مقاطع کارشناسی و کارشناسی ارشد، و همکارانم میتوانیم خودمان را بخوانیم، ترکیب کنیم، کدنویسی کنیم، حقیقت را بررسی کنیم، و تأیید کنیم. با دست. این به من اعتماد زیادی به داده های اساسی در تحقیق ما می دهد. من می خواستم توسط آهنگ آژیر اتوماسیون فریفته شوم، اما تا اینجای کار اینطور نیستم.
یادداشت:
[i] ناتان پی جونز و همکاران، “تحلیل شبکه اجتماعی ترکیبی از یک شبکه مواد مخدر فرامرزی: سازمان فرناندو سانچز (FSO)،” روندهای جرایم سازمان یافته 23، شماره 2 (1 ژوئن 2020): 154-82، آیزاک پوریتزکی، ناتان پی جونز، و جان پی. سالیوان، «کارتل های فراملی و باندهای زندان/زندان: تحلیل شبکه اجتماعی مافیای مکزیکی (ایما) و توطئه لا فامیلیا میچوآکانا موارد،” مجله جنگ های کوچک، 24 اکتبر 2022، جان پی. سالیوان، ناتان پی. جونز، و رابرت جی. بنکر، «یادداشت استراتژیک شماره 46 باندهای نسل سوم: تحقیقات نیروی ضربتی لس آنجلس در سازمان قاچاق سلاح ادعایی که سلاح و مهمات را در اختیار کارتل جالیس قرار می دهد. Nueva Generación (CJNG) مجله جنگ های کوچک: ال سنترو، 31 ژانویه 2022، 14، https://smallwarsjournal.com/jrnl/art/third-generation-gangs-strategic-note-no-46-los-angeles-strike-force-investigation-alleged.
[ii] سالیوان، جونز و بنکر، “یادداشت راهبردی شماره 46 باندهای نسل سوم: تحقیقات نیروی ضربتی لس آنجلس در سازمان ادعایی قاچاق سلاح که سلاح و مهمات را به کارتل Jalisco Nueva Generación (CJNG) ارائه می کند.
[iii] استفن پی بورگاتی، مارتین جی اورت، و لینتون سی فریمن، “Ucinet برای ویندوز: نرم افزار برای تجزیه و تحلیل شبکه های اجتماعی،” 2002، https://www.researchgate.net/publication/216636663_UCINET_for_Windows_Software_for_social_network_analysis.
[iv] مایکل کنی و استفان کولتارت، “چالش های روش شناختی استخراج شبکه های تاریک: به حداقل رساندن مثبت های کاذب از طریق مردم نگاری”، در شبکه های تاریک روشنگر: مطالعه گروه ها و سازمان های مخفی، ویرایش لوک گردس (کمبریج: انتشارات دانشگاه کمبریج، 2015)، https://www.researchgate.net/publication/321553872_The_methodological_challenges_of_extracting_tark_networks_Minimising_false_positives_through_thonography.
[v] هوش مصنوعی: هفته گذشته امشب با جان اولیور (HBO)، 2023،