همزمان با برگزاری کنفرانس بین المللی ICCKE2024 دانشگاه فردوسی مشهد، پانزدهمین دوره کارگاههای سالانه آزمایشگاه تخصصی فناوری وب WTLAB برگزار می گردد. در این دوره یک عنوان کارگاه با همکاری اعضاء هیات علمی و پژوهشگران آزمایشگاه تدارک دیده شده است.
بدین وسیله از کلیه علاقمندان به مباحث مطرح شده برای شرکت در این رویداد علمی-آموزشی دعوت به عمل می آید.
مشخصات کارگاه:
-
- مفاهیم نوین در مدلهای زبانی بزرگ (New concepts in large language models)
شنبه 3 آذر، ساعت 14 تا 18 شب
1) علی معمری، دانشجوی کارشناسی ارشد مهندسی کامپیوتر، نرمافزار، دانشگاه فردوسی مشهد؛ عضو آزمایشگاه فناوری وب
2) حسین فرهمند، دانشجوی کارشناسی ارشد مهندسی کامپیوتر، نرم افزار، دانشگاه فردوسی مشهد؛ عضو آزمایشگاه فناوری وب
3) امیرحسین درمانی، دانشجوی دکتری مهندسی کامپیوتر، هوش مصنوعی، دانشگاه فردوسی مشهد؛ عضو آزمایشگاه فناوری وب
4) سید محمد فیض آبادی ثانی، دانشجوی کارشناسی ارشد مهندسی کامپیوتر، نرم افزار، دانشگاه فردوسی مشهد؛ عضو آزمایشگاه فناوری وب
- مفاهیم نوین در مدلهای زبانی بزرگ (New concepts in large language models)
مخاطبان:
دانشجویان کارشناسی و کارشناسی ارشد مهندسی کامپیوتر، پزشکی، بیوتکنولوژی، هوش مصنوعی و نیز کلیه علاقمندان به موضوعات یاد شده در همه رشته ها
نحوه ثبت نام:
مراجعه به تلگرام
09150660935
@s_d_maghami
مزایای شرکت در کارگاه :
دریافت گواهی شرکت در کارگاه از سوی آزمایشگاه تخصصی فناوری وب WTLAB
مهلت ثبت نام:
تا 27 آبان ماه 1403
زمان برگزاری کارگاه :
3 آذرماه 1403
شیوه برگزاری : آنلاین
هزینه شرکت در کارگاه:
برای عموم علاقمندان – 300 هزار تومان
برای دانشجویان دانشگاه فردوسی مشهد – 200 هزار تومان
برای دانشجویان آزمایشگاه wtlab رایگان می باشد
نکته : 30 درصد تخفیف برای ثبت نام گروهی هر ۵ نفر.
نحوه شرکت و پرداخت هزینه:
علاقمندان به شرکت در این برنامه با توجه به توضیحات مندرج در صفحه مربوطه می توانند هزینه شرکت در کارگاه را به شماره کارت 6037997365537100 به نام محسن کاهانی نزد بانک ملی ایران واریز نمایند.
توجه مهم : لطفا پس از واریز مبلغ مورد نظر فیش واریزی خود را در تلگرام ارسال نمایید.
جزییات کارگاهWTLAB2024
اطلاعات کارگاه مفاهیم نوین در مدلهای زبانی بزرگ
سرفصل ها:
-
-
- تنظیم دقیق مدلهای زبانی بزرگ
– مدلهای زبانی بزرگ با میلیاردها پارامتر، در بسیاری از وظایف پردازش زبان طبیعی موفقیتهای قابل توجهی نشان دادهاند. با این حال، اندازه عظیم و نیازهای محاسباتی این مدلها چالشهایی جدی برای تنظیم دقیق (fine-tuning) آنها به منظور تطبیق با وظایف خاص پاییندستی، بهویژه در محیطهایی با منابع محاسباتی محدود ایجاد کرده است. رویکرد تنظیم دقیق بهینه پارامترها، (parameter-effecient fine-tuning: PEFT)، با تنظیم دقیق حداقل تعداد پارامترها و در عین حال دستیابی به عملکرد قابل مقایسه با تنظیم دقیق کامل، راه حل موثری را ارائه میدهد. در این ارائه تنظیم دقیق بهینه پارامترهای مدلهای زبانی بزرگ، با استفاده از رویکردهای PEFT بررسی میشود و با انجام آزمایشهایی اثربخشی آنها را در کارایی پارامتر و کارایی حافظه نشان داده میشود. - زنجیره افکار در مدلهای زبانی بزرگ
– در این مبحث با مفاهیم زنجیره افکار (Chain of Thought) در مدلهای زبانی بزرگ (LLMs) آشنا خواهید شد. این تکنیک به مدلها امکان میدهد تا مسائل پیچیده را به صورت گام به گام حل کنند و منطق بهتری ارائه دهند. ما به بررسی ساختارهای این زنجیرهها و کاربردهای عملی آن در حل مسائل و بهینهسازی پاسخهای هوش مصنوعی خواهیم پرداخت. - مدلهای زبانی بزرگ به عنوان داور
– مدلهای زبانی بزرگ به عنوان داور (LLM-as-a-judge)، به معنای استفاده از این فناوریها برای ارزیابی و قضاوت در مورد پاسخها و اطلاعات تولید شده است. در این نقش، مدلهای زبانی بزرگ میتوانند به تحلیل دقت، جامعیت و کیفیت پاسخها بپردازند و در زمینههای مختلفی به کار گرفته شوند. این مدلها با استفاده از دادههای آموزشی وسیع و الگوریتمهای پیشرفته، قادر به درک و تحلیل زبان طبیعی هستند و میتوانند به عنوان یک ابزار در تصمیمگیریهای پیچیده عمل کنند. نتیجه قابل توجه این است که مدلهای زبانی بزرگ مانند GPT-4 میتوانند به خوبی با ترجیحات انسانی کنترل شده و جمعسپاری شده مطابقت داشته باشند و بیش از 80% توافق را به دست آورند، که همان سطح توافق بین انسانها است. از این رو استفاده از مدلهای زبانی بزرگ به عنوان قاضی، یک روش مقیاسپذیر و قابل توضیح برای تقریب به ترجیحات انسانی است که در غیر این صورت بسیار پرهزینه به دست میآید. - آشنایی با تولید تقویت شده با بازیابی و کاربردهای آن
– در این مبحث به معرفی مفهوم کلی RAG (افزودن و استفاده از بازیابی (Retrieval) برای بهبود تولید (generation))، دلایل نیاز به آن و مزایا و کاربرد ها، معرفی دسته بندی مقالات RAG از نظر جایگاه استفاده از بازیابی و روش بهبود تولید با استفاده از آن و معرفی یک روش نمونه از هر دسته ، بررسی روند تکامل ساختار ها و روش های RAG و مقایسه و شباهت سنجی ساختار های مختلف RAG با دیگر روش های بهبود نتایج LLM، معرفی استراتژی های مختلف پیاده سازی RAG ، توضیح چالش ها و زمینه های فعالیت های آتی، ارائه و اجرای یک نمونه پیاده سازی ساده RAG خواهیم پرداخت.
- تنظیم دقیق مدلهای زبانی بزرگ
-