AI Singapore ร่วมกับ Google เปิดโครงการ Project SEALD พัฒนา LLM สำหรับภาษาไทย และในเอเซียตะวันออกเฉียงใต้

AI Singapore (AISG) และ ทีมวิจัยของ Google ประกาศความร่วมมือในการดำเนินโครงการ Project SEALD (Southeast Asian Languages in One Network Data) ซึ่งมุ่งเน้นการพัฒนาชุดข้อมูลและยกระดับความสามารถของโมเดลภาษาขนาดใหญ่ (Large Language Model – LLM) สำหรับภาษาต่างๆ ในเอเชียตะวันออกเฉียงใต้ เพื่อให้โมเดลเหล่านี้สามารถเข้าใจบริบททางวัฒนธรรมและนำไปใช้เพื่อสร้างประโยชน์ในภูมิภาคได้ดียิ่งขึ้น

Project SEALD จะครอบคลุมภาษาไทย อินโดนีเซีย ทมิฬ ฟิลิปปินส์ และพม่า

โดยมีเป้าหมายในการสร้างคลังข้อมูลที่มีคุณภาพของภาษาเหล่านี้เพื่อสนับสนุนการพัฒนากลุ่มโมเดลภาษาขนาดใหญ่ภายใต้โครงการ SEA-LION (Southeast Asian Languages in One Network) ของ AISG ที่ต้องการนำเสนอบริบททางวัฒนธรรมและภาษาในภูมิภาคนี้ได้อย่างแม่นยำ

การวิจัยภายใต้ Project SEALD จะครอบคลุมด้านต่างๆ ได้แก่ การพัฒนาโมเดลการแปลโดยคำนึงถึงความเหมาะสมกับบริบททางวัฒนธรรม การสร้างแนวทางสำหรับชุดข้อมูลที่ใช้ปรับแต่งโมเดล การพัฒนาเครื่องมือและการเผยแพร่สูตรการฝึกล่วงหน้าสำหรับภาษาในภูมิภาค ชุดข้อมูลและผลลัพธ์จากโครงการนี้จะเผยแพร่แบบโอเพนซอร์สเพื่อกระตุ้นความก้าวหน้าและส่งเสริมความเชี่ยวชาญด้านเทคโนโลยีโมเดลภาษาในเอเชียตะวันออกเฉียงใต้

นอกจากนี้ AISG จะร่วมมือกับพาร์ทเนอร์ต่างๆ ทั้งจากภาคการศึกษา ภาคอุตสาหกรรม และภาครัฐ ในการพัฒนาคุณภาพของข้อมูล การประเมินโมเดล และการต่อยอดประยุกต์ใช้งานเพื่อสาธารณประโยชน์ในระดับภูมิภาค AISG ยังได้ทำข้อตกลงความร่วมมือกับหน่วยงานในหลายประเทศในภูมิภาคเพื่อพัฒนาทรัพยากรที่เกี่ยวข้องอีกด้วย

โครงการนี้จะช่วยให้เข้าถึงโมเดลภาษาขนาดใหญ่ที่พัฒนาภายใต้ SEA-LION ได้ง่ายขึ้นบนแพลตฟอร์มและเครื่องมือต่างๆ เช่น Model Garden บน Veex AI ของ Google Cloud และ Hugging Face ซึ่งจะช่วยให้องค์กรและนักพัฒนาสามารถใช้งานและปรับแต่งโมเดลเหล่านี้ได้ตามความต้องการ

Project SEALD ถือเป็นความพยายามร่วมกันที่สำคัญในการยกระดับการพัฒนา AI ให้มีความครอบคลุมและเกิดประโยชน์แก่ผู้คนในภูมิภาคนี้อย่างแท้จริง โดยเชิญชวนให้หน่วยงานและผู้เชี่ยวชาญที่สนใจสมัครเข้าร่วมโครงการเพื่อร่วมกันสร้างนวัตกรรมทางภาษาสำหรับอนาคต

สามารถดูรายละเอียดเพิ่มเติมเกี่ยวกับ AISG ได้ที่ https://www.aisingapore.org