داستان های داده | اختلاط تکنولوژی | پلتفرم تحلیلی KNIME
TL;DR: همه یک وبلاگ ChatGPT دارند – پس چرا برخی از کارهای تحلیلی را با این ابزار محبوب هوش مصنوعی، KNIME و Python انجام ندهید؟ فقط کمی احتیاط و وافل اضافه کنید…
به مجموعه ChatGPT-flows در مرکز انجمن KNIME بروید
من از پیشینه ChatGPT صرف نظر می کنم زیرا مقالات و وبلاگ های زیادی در مورد آن وجود دارد. با این حال، من این بینش را توسط کاربر KNIME توبیاس شلوتر با نشان دادن یک ” به اشتراک خواهم گذاشتمنحنی سازگاریکه بسیاری از ما تجربه کرده ایم:
در هفته های گذشته، من از ChatGPT برای چندین کار در مورد تجزیه و تحلیل داده ها، یادگیری ماشینی و مدیریت داده ها (مهندسی؟) استفاده کرده ام.
کاری که من انجام دادم استفاده از ChatGPT برای بحث در مورد تنظیم هایپرپارامتر برای مدل های یادگیری ماشینی بود. LightGBM و XGBoost با استفاده از بسته Optuna.
البته، چندین مثال برای استفاده از Optuna وجود دارد – در مثال من، با استفاده از به اصطلاح ‘سرشماری-درآمدمجموعه دادههای مربوط به دستمزد در ایالات متحده، برخی از ویژگیهای عجیب و غریب با دادههای طبقهبندی و برخی اعداد صحیح (32 بیت، 64 بیت …) وجود داشت. ChatGPT توانست این مسائل را مورد بحث قرار دهد و من برخی تنظیمات را برای آماده سازی بهتر داده ها و ذخیره سازی آماده سازی ها اجرا کردم. شما می توانید جزئیات را در اینجا بخوانید و همچنین نمونه ها را تست کنید:
در مرحله بعد، میخواهم نمونههایی را به شما نشان دهم که در آنها وظایف کوچکتر و گاهی عجیبتری داشتم که در آنها یک ایده فوری یا یک گردش کار KNIME برای حل آنها نداشتم – یا من خیلی تنبل بودم که خودم آن را حل کنم. شهود من این بود که ممکن است راه حل پایتون وجود داشته باشد.
در زمانهای گذشته، سعی و خطا و تحقیق با گوگل و StackOverflow داشتم، و گاهی اوقات از تلاش برای صادق بودن دست میکشیدم. اما با کمک دستیار برنامه نویسی جدید (وفادار) من، اغلب کار بسیار کوچکتری بود که مشکل کسی را حل می کرد یا حداقل به دنیا نشان می داد که چگونه این کار عجیب و غریب را می توان با پایتون (و KNIME) انجام داد.
من برخی از افکار اولیه را در مورد آن در لینکدین آورده ام:
به عنوان مثال، یک سوال در انجمن KNIME در مورد تبدیل برخی از کدهای رنگ وجود داشت – کاری که من واقعاً با آن آشنا نبودم. بنابراین من از ChatGPT پرسیدم و کد به پایتون و R (طبق درخواست) برگشت. من همچنین درباره خطاهای رخ داده صحبت کردم – که نشان می دهد کد فقط نوشته شده است اما هرگز به صورت داخلی آزمایش نشده است. بنابراین برخی از خطاهای ساده مانند فراموش کردن وارد کردن بخشی از یک بسته باید اصلاح شوند:
سپس کد را می توان در یک گردش کار KNIME با برخی سازگاری های جزئی مانند پورت های ورودی و خروجی برای ادغام داده ها استفاده کرد:
علاوه بر این ChatGPT می تواند خلاصه ای از آنچه در کد شما اتفاق می افتد به شما ارائه دهد. یک تیتر کوتاه هم خواستم:
در صورتی که شما تعجب می کنید چه اتفاقی برای کد R درخواستی افتاد: بعد از اینکه ChatGPT نتوانست راه حلی را در چند دور تولید کند و برای تحقیق بیشتر در مورد آن انرژی نداشتم آن را رها کردم. البته ممکن است خطری در چنین رویکردی وجود داشته باشد که فقط یک راه حل خوب (کاربردی) را چکش کند – اما، از طرف دیگر، یک متخصص اکنون مکانی برای شروع و بهبود بیشتر یک راه حل دارد – و امیدواریم آن را به صورت واقعی آزمایش کند. زندگی
بنابراین ChatGPT (در حال حاضر) یک است زبان مدل (برخی ممکن است بگویند “فقط” تکمیل خودکار پیشرفته). بنابراین پاسخ ها بر گفتار و بهترین ترکیب اطلاعاتی که قبلاً وجود دارد متمرکز است. سایر سازگاری ها ظاهراً ثانویه هستند یا فقط در صورتی وجود دارند که داده های آموزشی شامل پاسخ صحیح (و اولویت بندی شده باشند). به طور عمده:
- به نظر می رسد وجود دارد هیچ پردازشگر واقعی “ثبات ریاضی”.. بنابراین برخی از محاسبات ممکن است به سادگی اشتباه باشند. همچنین من سعی کردم اعدادی را برای شبیه سازی بهینه سازی ایجاد کنم و آنها هرگز واقعاً مناسب نباشند.
- کد تست نمی شود. کد داده شده همانطور که تصور می شود باید باشد نوشته می شود اما اغلب کار می کند. گاهی اوقات برخی از “ویژگی ها” به سادگی بیش از حد خوب هستند که واقعی باشند. کد-syntax مطمئناً به این شکل خواهد بود … اگر فقط تابع در این بسته پایتون وجود داشت.
- کامل بودن – چگونه مطمئن شویم که هر چیزی که باید وجود داشته باشد در واقع وجود دارد؟ من از ChatGPT خواستم تا یک رسید برای وافل (به زبان آلمانی) با آب گازدار تهیه کند – این کار را انجام داد و مقداری شیر اضافه کرد. بعد از من به طور خاص پرسیدم. اما در ابتدا تخم مرغ و همچنین بکینگ پودر را کنار گذاشت. همچنین اندازهگیریها تا حدی از حد قابل قبول نبودند – باید خودتان آنها را تنظیم میکردید. همین سوال در انگلیسی بهتر جواب داد اما کامل نبود.
- گاهی اوقات به طرز بدی شکست می خورد – من شکست های کامل را با کارهای به ظاهر ساده تجربه کرده ام. ChatGPT به اختراع تنظیمات پایتون و تکرار آنها ادامه داد و حتی پس از 30 تا 40 (بله!) آزمایش و تغییرات و نکاتی از طرف من برای اتمام کار، قادر به انجام نشد.
البته ممکن است این نکات در نسخه های بعدی بهبود یابد. بنابراین اگر به نحوی بدانید که چه کاری می خواهید انجام دهید و سطحی از درک مفاهیم اساسی – کد یا پخت – داشته باشید، بهترین کار را دارد.
یک نکته اساسی و شاید واضح باشد، اما با این وجود آن را می گویم: هر چیزی که به ChatGPT می گویید می تواند (و احتمالاً) برای بهبود ابزار استفاده شود. بنابراین مراقب باشید که آیا ممکن است اطلاعات حساس (شخصی) را به اشتراک بگذارید. همچنین: نتایج ممکن است حاوی مطالب دارای حق چاپ باشد. بنابراین از نحوه برنامه ریزی برای استفاده از نتایج نیز آگاه باشید.