უხილავი მუშახელის ეპოქა და მისი მომავალი
ხელოვნური ინტელექტი დღეს კაცობრიობის განვითარების ყველაზე მასშტაბური ტალღის სიმბოლოა. მას ასოცირებენ მაღალი ტექნოლოგიებით, რობოტებითა და ალგორითმებით, რომლებიც თითქოს ადამიანების

ხელოვნური ინტელექტი დღეს კაცობრიობის განვითარების ყველაზე მასშტაბური ტალღის სიმბოლოა. მას ასოცირებენ მაღალი ტექნოლოგიებით, რობოტებითა და ალგორითმებით, რომლებიც თითქოს ადამიანების ჩარევის გარეშე ქმნიან შთამბეჭდავ შედეგებს. თუმცა AI-ის რეალობა გაცილებით კომპლექსურია — მის უკან დგას მრავალმილიონიანი, უმეტესად უხილავი, გლობალური მუშახელი, რომელიც უმნიშვნელოვანეს როლს თამაშობს სისტემების სწავლებაში, კორექტირებაში და გაფართოებაში.
ეს მუშახელი შედგება იმ ადამიანებისგან, ვინც წლების განმავლობაში ნიშნავდა სურათებზე საგნებს, აკეთებდა ხმოვანი ფაილების ანოტაციას, წერდა ტექსტებსა და კოდს, ამოწმებდა მოდელების პასუხებს და აფასებდა მათ ზუსტობას. ზოგისთვის ეს იყო ფულის შოვნის შესაძლებლობა, ზოგისთვის კი ერთადერთი შემოსავლის წყარო განვითარებად ქვეყნებში.
იმისათვის, რომ თანამედროვე მოდელებს ესმოდეთ, რას ნიშნავს “დამუხრუჭება” მოძრაობაში, ან როგორ უნდა გაშიფრონ ადამიანის მეტყველება, საჭიროა მათ ჰქონდეთ წვდომა ათასობით ხელით გაანალიზებულ და სწორად დამიწებულ მაგალითზე. ეს პროცესები სწორედ ადამიანებზეა დამოკიდებული — ადამიანებზე, რომელთა სახელებიც არცერთ პრეზენტაციაში არ ახსენებენ და არცერთ საინვესტიციო დოკუმენტში არ არიან წარმოდგენილნი.
მაგალითისთვის, ამერიკელმა მკვლევარმა ფეი–ფეი ლიმ, რომელიც ხელოვნური ინტელექტის “მიდლდაუნ დედად” ითვლება, 2000-იან წლებში Amazon-ის პლატფორმა Mechanical Turk–ის მეშვეობით შეკრიბა მსოფლიოდან ასიათასობით ანოტატორი და შექმნა ImageNet — ყველაზე დიდი სურათების ბაზა, რომელმაც დღევანდელი ვიზუალური AI-ს განვითარება შესაძლებელი გახადა.
თუმცა, როგორც ჩანს, ეს მოდელი იცვლება. ახალი AI სისტემები, განსაკუთრებით დიდი ენობრივი მოდელები (LLM), სულ უფრო ნაკლებად საჭიროებენ ხელით ანოტირებულ მონაცემებს. მაგალითად, კომპანია OpenAI და სხვა წამყვანი ლაბორატორიები უკვე მიმართავენ თვითდასწავლებად ალგორითმებს, გაძლიერებულ სწავლებას და სინთეზურ მონაცემებს.
მიუხედავად ამისა, ადამიანების როლი არ ქრება. უბრალოდ იცვლება. ანოტატორებისგან დღეს უკვე მოითხოვება პროგრამული უნარები, სპეციალიზებული დარგობრივი ცოდნა და ანალიზის უნარი. ეს უკვე აღარ არის მხოლოდ კატის და ძაღლის გარჩევა ფოტოებზე — მათ უნდა შეაფასონ ალგორითმის პასუხები, ახსნან, რატომაა რაღაც სწორად ან არასწორად გაცემული, და ხშირად უკეთესადაც ჩამოაყალიბონ პასუხები.
მაშინ როდესაც ინდოეთში ანოტატორთა ბაზარი 2030 წლისთვის შესაძლოა 1 მილიონ ადამიანს გადაცდეს, და შემოსავალი 7 მილიარდ დოლარს მიაღწიოს, გლობალურად იზრდება მოთხოვნა მათზე, ვინც ფლობს უცხო ენებს, ვინც შეძლებს ისეთი მონაცემების მომზადებას, რაც სისტემებს ენობრივად და კულტურულად უფრო მულტინაციონალურს გახდის.
მაგრამ არსებობს რისკიც. მას შემდეგ, რაც ტექნოლოგიური გიგანტები სულ უფრო მეტი ყურადღებას უთმობენ “არამაგიური“, თვითსწავლის სისტემებს, ადამიანების მიერ შესრულებული შავი სამუშაო მარტივად შეიძლება გაუფასურდეს. ბევრს ეკისრება მკაცრი მონიტორინგი, დაბალი ანაზღაურება, ხოლო მათი შრომის შედეგი უმეტესად არ ჩანს — ან წარედგინება როგორც ტექნოლოგიის “ავტომატური” მიღწევა.
თუმცა, როგორც ეს სტატია ხაზს უსვამს, მოდელის საბოლოო ქმედითობა, სისწორე და ეთიკურობა მაინც ადამიანების მონაწილეობაზეა დამოკიდებული. სწორედ ადამიანების უკუკავშირის საფუძველზე დაიწყო ChatGPT-ს პასუხების სელექცია და უსაფრთხოების ფილტრის განვითარება. და, როგორც აღმოჩნდა, მოდელის ენობრივი „ხასიათიც“ ხშირად სწორედ იმ ქვეყნებიდან გადმოიცემა, საიდანაც მოდიან ანოტატორები — აფრიკული ინგლისური სიტყვები, აზიური კონსტრუქციები და სხვა ენობრივი ნიშნები ტოვებენ კვალს AI-ს ენაზე.
ეს პროცესი გაცილებით ჰგავს ბავშვის აღზრდას, ვიდრე ტექნოლოგიის დანერგვას. და როგორც ბავშვი სჭირდება არამხოლოდ მშობელს, არამედ მთელ თემს, ისე ხელოვნური ინტელექტიც მოითხოვს ადამიანურ მრავალფეროვნებას, ცოდნას და ეთიკურ თანადგომას. მომავალი, რომელშიც მანქანები სწავლობენ ადამიანების გარეშე, ჯერ კიდევ შორია. და სანამ იმ მომენტამდე მივალთ, ადამიანები ჯერ კიდევ რჩებიან ამ სისტემების ყველაზე კრიტიკულ ნაწილად — ხანდახან უხილავად, მაგრამ ყოველთვის აუცილებლად.
მომზადებულია – nytimes.com მასალების მიხედვით