AI สิงค์โปร์ ร่วมมือ AWS สร้างโมเดล “Generative AI”

Spread the love

 

AI สิงค์โปร์ (AI Singapore: AISG) ร่วมมือกับ AWS สร้างโมเดล Generative AI ที่ครอบคลุมประเทศในเอเชียตะวันออกเฉียงใต้ บนโครงการ SEA-LION 

 

การวิเคราะห์แนวโน้มเทคโนโลยีในปี 2567 ของเวอร์เนอร์ โวเกลส์ (Werner Vogels) ซีทีโอของบริษัท Amazon ได้คาดการณ์ไว้ว่า Generative AI จะสามารถรับรู้ด้านวัฒนธรรมมากขึ้น โดยการเทรนโมเดลภาษาขนาดใหญ่ (Large language models: LLM) ซึ่งเป็นแขนงหนึ่งในหมวดหมู่ของเทคโนโลยีปัญญาประดิษฐ์ (Artificial intelligence: AI) ด้วยข้อมูลที่หลากหลาย จึงนำไปสู่ผลลัพธ์ที่ลึกซึ้งและแม่นยำยิ่งขึ้น เป้าหมายหลักคือการทำให้ Generative AI เข้าถึงผู้คนหลากหลายกลุ่มและเป็นประโยชน์แก่ผู้ใช้ทั่วโลก

 

อย่างไรก็ตาม LLM นั้นพึ่งพาข้อมูลที่ได้รับจากอินเทอร์เน็ต ซึ่งส่วนใหญ่มักเป็นในรูปแบบภาษาและอักษรที่ถูกใช้จำนวนมาก อย่างเช่นภาษาอังกฤษ ที่มีข้อมูลสำหรับการประมวลผลภาษาธรรมชาติ (Natural language processing: NLP) อยู่มากมาย สิ่งสำคัญที่องค์กรต่าง ๆ มองข้ามไม่ได้คือความสามารถในการดัดแปลง LLM ด้วยข้อมูลและภาษาท้องถิ่น เพื่อส่งเสริมความมีส่วนร่วมในสังคม กระตุ้นการเติบโตทางเศรษฐกิจด้วยการเปิดตลาดใหม่ ๆ และสร้างประสบการณ์ที่ดียิ่งขึ้นให้กับประชาชน

 

วัฒนธรรมมีผลในทุกๆ อย่าง นี่เป็นสิ่งที่ผลให้ AI สิงค์โปร์ (AI Singapore: AISG) ซึ่งเป็นโครงการของภาครัฐริเริ่มโดยมูลนิธิเพื่อการวิจัยแห่งชาติของสิงค์โปร์ (National Research Foundation) เพื่อเสริมสร้างศักยภาพของประเทศในด้าน AI และทำให้ LLM มีความแม่นยำตรงกับบริบททางวัฒนธรรมของแต่ละประเทศมากยิ่งขึ้น โดยเฉพาะสำหรับประเทศในภูมิภาคเอเชียตะวันออกเฉียงใต้

 

โครงการ SEA-LION 

 

ต่อยอดจากโครงสร้างพื้นฐานของ AWS ที่มีความยืดหยุ่นในการปรับขนาดได้อย่างง่ายดาย AISG ได้พัฒนา SEA-LION ซึ่งเป็นโครงการด้าน LLM ที่ถูกเทรนและรับคำสั่งเฉพาะเจาะจงสำหรับภาษาและวัฒนธรรมจากประเทศในเอเชียตะวันออกเฉียงใต้ (การเทรนล่วงหน้าและรับคำสั่งแบบ instruct-tuned เป็นวิธีการที่ช่วยให้สามารถควบคุมพฤติกรรม LLM ได้ดียิ่งขึ้น) โครงการแรกในภูมิภาค SEA-LION ยังทำหน้าที่เป็นรากฐาน

 

สำหรับโครงการ National Multimodal LLM ของสิงคโปร์ ซึ่งมีส่วนสนับสนุนในการวิจัยและนวัตกรรมด้าน AI ของประเทศอีกด้วย โครงการนี้เป็นส่วนหนึ่งของ National AI Strategy 2.0 ซึ่งเป็นแผนการใช้เทคโนโลยี AI ในสิงคโปร์ให้ลึกซึ้งยิ่งขึ้น โมเดลนี้จะมุ่งเน้นไปที่ภาษาที่มีการใช้งานอย่างแพร่หลายในเอเชียตะวันออกเฉียงใต้ เช่น บาฮาซาอินโดนีเซีย บาฮาซามลายู ไทย และเวียดนาม และในระยะยาวจะถูกขยายไปยัง ภาษาอื่น ๆ ในเอเชียตะวันออกเฉียงใต้เข้ามา เช่น พม่าและลาว

 

การสร้าง LLM ที่ครอบคลุมหลายประเทศในระดับภูมิภาคนั้นต้องใช้ข้อมูล[เชิงลึก]และเจาะจง กับท้องถิ่นในภาษาที่เกี่ยวข้องอีกด้วย ตัวอย่างของความแตกต่างทางภาษาท้องถิ่นคือคำว่า “LOL” (คำย่อของ “laughing out loud” ในภาษาอังกฤษ) ในประเทศไทยคนมักใช้ “55555”

 

ในขณะที่ชาวอินโดนีเซียมักใช้ “wkwkwk” LLM ที่ได้รับการเทรนด้วยข้อมูลที่หลากหลายทางวัฒนธรรม เช่น SEA-LION ช่วยเพิ่มความสามารถของแอปพลิเคชัน Generative AI ให้เข้าใจแง่มุมที่ละเอียดอ่อน เหมาะแก่ประสบการณ์ใช้งานของมนุษย์ อีกทั้งยังสามารถเข้าใจความซับซ้อนทางสังคมที่อาจเป็นอุปสรรคอีกด้วย

 

การเร่งพัฒนา Generative AI แบบเจาะจง

 

SEA-LION พร้อมใช้งานแล้วบน Amazon SageMaker JumpStart รวมทั้งโมเดลที่ได้รับการเทรนล่วงหน้า (pre-trained models) และเปิดให้ใช้งานแบบสาธารณะ เพื่อช่วยลูกค้าทั่วโลกในการเริ่มต้นใช้งานกับแมชชีนเลิร์นนิง (ML) โมเดล SEA-LION ที่ได้เปิดตัวไปแล้วมีขนาดที่ค่อนข้างเล็กด้วยพารามิเตอร์ขนาด 3 พันล้านและ 7 พันล้าน

 

และได้รับการเทรนโดยใช้ Amazon EC2 ซึ่งเป็นบริการที่ให้ความสามารถในการประมวลผลที่ปรับขนาดได้บนคลาวด์ โมเดลรุ่นเล็ก ๆ เหล่านี้มีความยืดหยุ่นและเข้าถึงได้ง่ายกว่า LLM ที่ใช้กันทั่วไปในตลาดปัจจุบัน ซึ่งโดยปกติแล้วจะมีขนาดหลายแสนล้านพารามิเตอร์

 

ในช่วงปลายเดือนมกราคม พ.ศ. 2567 AISG ได้ทำการเปิดตัวโมเดล SEA-LION เชิงพาณิชย์ ด้วยพารามิเตอร์เพื่อรองรับการปรับแต่งคำสั่งและจะมีความสามารถมากขึ้นในการจับความแตกต่างทางภาษาในเอเชียตะวันออกเฉียงใต้ รวมไปถึงปรับปรุงความเข้าใจในบริบทต่าง ๆ พัฒนาการใช้เหตุผลในหลายภาษา และสร้างผลลัพธ์ที่มีบริบทมากยิ่งขึ้น

 

พอล คอนดิลิส ผู้ช่วยรองประธาน (AVP) ด้าน Data Science ที่ Tokopedia กล่าวว่า การที่ AISG ให้ความสำคัญกับภาษาท้องถิ่นในเอเชียตะวันออกเฉียงใต้ที่ไม่ค่อยมีบทบาทนั้นมีความสำคัญอย่างมาก เนื่องจากลูกค้าส่วนใหญ่ของเราที่ Tokopedia โต้ตอบกับเราในภาษาบาฮาซา อินโดนีเซีย การพัฒนาโมเดลที่มีความคล่องแคล่วในภาษาท้องถิ่นนั้น จะช่วยเพิ่มประสิทธิภาพของเราในการสื่อสารกับลูกค้าและพัฒนาประสบการณ์ของพวกเขา เรากำลังอยู่ในระยะทดลองขั้นต้นกับ SEA-LION ซึ่งโดยรวมดูมีแนวโน้มที่ดี

 

หยิง เฉาเหว่ย หัวหน้านักวิทยาศาสตร์ที่ NCS กล่าวว่า ในขณะที่เทคโนโลยีกำลังพัฒนาไปอย่างรวดเร็วในเอเชียแปซิฟิก เรามองเห็นโอกาสที่น่าตื่นเต้นในการปรับแต่งโมเดลภาษาเพื่อสะท้อนถึงความหลากหลายทางภาษาในภูมิภาค และพลิกโฉมวิธีการประมวลผลและแบ่งปันข้อมูล เรายินดีที่ได้ทำงานอย่างใกล้ชิดกับ AISG ในโครงการ SEA-LION LLM ที่ใช้ประโยชน์จากทรัพยากรของ AWS

 

โครงการนี้ช่วยลดความเหลื่อมล้ำทางดิจิทัลโดยการปรับปรุงการสื่อสารระหว่างวัฒนธรรม และมอบประสบการณ์ทีเจาะจงให้สำหรับแต่ละท้องถิ่น นอกจากนี้ ธุรกิจและภาครัฐยังสามารถใช้ประโยชน์จากความเชี่ยวชาญของ NCS ในการตอบสนองความต้องการทางธุรกิจผ่านการใช้แอปพลิเคชันที่ขับเคลื่อนด้วย LLM เพื่อควบคุมศักยภาพสูงสุดของ LLM ในโครงการ SEA-LION อีกด้วย

 

ML และการประมวลผลที่คุ้มค่า

 

การสร้าง การเทรน และการใช้งาน LLM ต้องใช้เวลา ทรัพยากรการประมวลผลจำนวนมาก และความเชี่ยวชาญ AISG จึงได้ร่วมมือกับ AWS เพื่อจัดการกับความท้าทายเหล่านี้ โดยการใช้ประสิทธิภาพอันทรงพลังของคลาวด์สำหรับงานต่าง ๆ เช่น การเทรน ML และการประมวลผลประสิทธิภาพสูงโดยใช้ NVIDIA A100 Tensor Core GPU ซึ่งมอบผลลัพธ์ระดับสูงสุดพร้อมเครือข่ายที่รวดเร็วและตอบสนองไว

 

ขนาดที่กะทัดรัดของ SEA-LION ทำให้มีความคุ้มค่าและประสิทธิภาพมากกว่า LLM ขนาดใหญ่ ที่มีพารามิเตอร์มากกว่าหลายร้อยเท่า LLM ขนาดเล็กช่วยให้นักพัฒนาสามารถใช้งานได้เร็วขึ้น ปรับแต่งได้ในราคาที่ถูกกว่า และดำเนินการได้รวดเร็วยิ่งขึ้นในระหว่างการเทรน ความง่ายในการปรับใช้ LLM ขนาดเล็กบนอุปกรณ์เคลื่อนที่หรือที่ Edge ยังช่วยให้ธุรกิจต่าง ๆ สามารถนำมาใช้และสร้างแอปพลิเคชันได้ง่ายขึ้นอีกด้วย

 

ดร. เลสลี่ย์ เทียว ผู้อำนวยการอาวุโสฝ่ายผลิตภัณฑ์ AI ของ AISG กล่าวว่า “การสร้าง LLM จำเป็นต้องมีโครงสร้างพื้นฐานระบบคลาวด์ที่เชื่อถือได้และพร้อมใช้งานทุกเมื่อ โดย AWS ช่วยให้เราสามารถปรับขนาดได้อย่างคุ้มค่า เราสร้าง LLM ที่มีพารามิเตอร์ 3 พันล้านในเวลาเพียงสามเดือนด้วย AWS

 

และตั้งแต่นั้นมาเราได้ปรับขนาดโมเดลเป็น 7 พันล้านพารามิเตอร์ เพื่อขยายการเข้าถึงไปยังผู้คนมากขึ้น การทำงานร่วมกับ AWS ทำให้เราสามารถมุ่งเน้นไปที่การเทรนโมเดลของเราเพียงอย่างเดียวแทนที่จะต้องจัดการโครงสร้างพื้นฐาน ปัจจัยนี้จึงช่วยเร่งการพัฒนา LLM ที่เป็นเอกลักษณ์ และสะท้อนถึงความหลากหลายในภูมิภาคของเรา

 

เอลซี่ ตัน ผู้จัดการประจำประเทศสิงคโปร์ ฝ่ายภาครัฐทั่วโลก ที่ AWS กล่าวว่า “LLM ที่มีความเฉพาะด้านภาษาและวัฒนธรรม เช่น SEA-LION ของ AISG จะช่วยให้การสื่อสารและความเข้าใจระหว่างวัฒนธรรมราบรื่นยิ่งขึ้น ช่วยรักษารายละเอียดทางวัฒนธรรม และช่วยให้ภาครัฐและธุรกิจสามารถให้บริการประชาชนและลูกค้าในเอเชียตะวันออกเฉียงใต้ได้ดีขึ้น

 

เรารู้สึกตื่นเต้นที่ได้ช่วย AISG ปลดล็อกศักยภาพของ Generative AI เพื่อสร้างประโยชน์มากมายให้กับเศรษฐกิจต่างๆ ในอาเซียน เราหวังว่าจะได้ช่วยให้ AISG ขยายการเข้าถึงของ LLM ด้วยเครือข่ายลูกค้าและพาร์ทเนอร์ของเราในภูมิภาค

Scroll to Top