Ilon Mask sun’iy intellekt sohasidagi boshqa mutaxassislarning sun’iy intellekt modellarini o‘qitish uchun haqiqiy ma’lumotlar deyarli qolmagan degan fikriga qo‘shildi.
"Biz sun’iy intellektni o‘qitish uchun to‘plangan inson bilimlarining deyarli barcha hajmini tugatdik. Bu aslida o‘tgan yili sodir bo‘lgan," - dedi Mask X platformasida Stagwell raisi Mark Penn bilan suhbatda.
XAI kompaniyasi egasi Mask OpenAI kompaniyasining sobiq bosh ilmiy xodimi Ilya Sutskever dekabr oyida NeurIPS mashinali o‘qitish konferensiyasida aytgan g‘oyalarni qo‘llab-quvvatladi. Sun’iy intellekt sanoatida "ma’lumotlar cho‘qqisiga" erishishni e’lon qilgan Sutskever ta’lim ma’lumotlarining yetishmasligi modellarni ishlab chiqishda mavjud yondashuvlarni o‘zgartirishga majbur bo‘lishini bashorat qildi.
Mask yechim - sun’iy intellekt modellari tomonidan yaratilgan sintetik ma’lumotlardan foydalanishni taklif qildi. "Haqiqiy ma’lumotlarni to‘ldirishning yagona yo‘li bu sun’iy intellektning o‘zi o‘quv materiallarini yaratadigan sintetik ma’lumotlardir. Sun’iy intellekt sintetik ma’lumotlar bilan o‘zini o‘zi baholaydi va o‘zini o‘zi o‘rganish jarayonidan o‘tadi," - dedi u.
Microsoft, Meta*, OpenAI va Anthropic kabi yirik texnologik kompaniyalar o‘zlarining flagman sun’iy intellekt modellarini o‘qitish uchun sintetik ma’lumotlardan allaqachon foydalanmoqda. Gartner ma’lumotlariga ko‘ra, 2024-yilda sun’iy intellekt va tahlil sohasidagi loyihalar uchun ishlatiladigan ma’lumotlarning 60 foizi sun’iy ravishda yaratilgan. Ochiq kodi shu hafta e’lon qilingan Microsoft Phi-4 modeli sintetik va real ma’lumotlar kombinatsiyasi asosida o‘qitildi. Xuddi shunday yondashuv Google Gemma modellarini yaratishda qo‘llanilgan. Anthropic o‘zining eng samarali tizimlaridan biri - Claude 3.5 Sonnetni ishlab chiqishda sintetik ma’lumotlardan foydalangan va Meta* sun’iy intellekt yordamida yaratilgan ma’lumotlar yordamida Llama modellarining so‘nggi seriyasini yaxshilagan.
Sintetik ma’lumotlar asosida o‘qitish bir qator afzalliklarga, jumladan, iqtisodiy samaradorlikka ega. "Writer" startapining ta’kidlashicha, ularning deyarli to‘liq sintetik manbalardan ishlab chiqilgan "Palmyra X 004" modeli atigi 700 000 dollarga tushdi - bu taqqoslanadigan OpenAI modeli uchun 4,6 million dollarlik baholangan qiymatga nisbatan.
Lekin kamchiliklar ham bor. Ba’zi tadqiqotlar shuni ko‘rsatadiki, sintetik ma’lumotlar "modelning qulashiga" olib kelishi mumkin, bunda sun’iy intellekt o‘z natijalarida kamroq "kreativ" va ko‘proq noxolis bo‘lib qoladi, bu oxir-oqibat uning funksionalligini jiddiy buzishi mumkin. Modellar mavjud ma’lumotlar asosida sintetik ma’lumotlarni yaratishi sababli, dastlabki ma’lumotlardagi har qanday noto‘g‘ri tushunchalar va cheklovlar ularning natijalarida aks ettiriladi.