Alibaba Group Holding ก้าวหน้าในวงการปัญญาประดิษฐ์ (AI) ด้วยการเปิดตัวโมเดลภาษาใหญ่เฉพาะด้านคณิตศาสตร์ (LLMs) ที่ชื่อ Qwen2-Math ซึ่งบริษัทอ้างว่าสามารถทำงานได้ดีกว่า GPT-4 ของ OpenAI ในด้านการแก้ปัญหาคณิตศาสตร์
ทีม Qwen ซึ่งเป็นส่วนหนึ่งของหน่วยประมวลผลคลาวด์ของ Alibaba เปิดเผยว่า ตลอดปีที่ผ่านมา บริษัทได้ทุ่มเทในการวิจัยและพัฒนาความสามารถในการแก้ปัญหาเชิงเหตุผลของโมเดลภาษาใหญ่ โดยมุ่งเน้นไปที่การแก้ปัญหาคณิตศาสตร์เป็นพิเศษ
Qwen2-Math มีโมเดลสามขนาด โดยโมเดลที่มีจำนวนพารามิเตอร์มากที่สุดคือ Qwen2-Math-72B-Instruct ที่สามารถเอาชนะโมเดลพัฒนาในสหรัฐฯ ในการทดสอบคณิตศาสตร์ได้ เช่น GPT-4, Claude 3.5 Sonnet ของ Anthropic, Gemini 1.5 Pro ของ Google และ Llama-3.1-405B ของ Meta
ทีมงานของ Alibaba หวังว่า Qwen2-Math จะเป็นประโยชน์ต่อชุมชนวิชาการในการแก้ปัญหาคณิตศาสตร์ที่ซับซ้อน โมเดลเหล่านี้ได้รับการทดสอบกับการวัดมาตรฐานคณิตศาสตร์ทั้งภาษาอังกฤษและภาษาจีน รวมถึง GSM8K, OlympiadBench และการสอบเข้ามหาวิทยาลัย Gaokao ของจีน
อย่างไรก็ตาม ทีมงานระบุว่าโมเดลยังคงมีข้อจำกัดบางประการเนื่องจากรองรับเฉพาะภาษาอังกฤษเท่านั้น โดยวางแผนที่จะเปิดตัวโมเดลสองภาษาในไม่ช้านี้ และกำลังพัฒนาโมเดลที่รองรับหลายภาษา
การเปิดตัวโมเดลคณิตศาสตร์เฉพาะทางของ Alibaba ยิ่งตอกย้ำความสำเร็จของบริษัทในวงการ AI หลังจากที่ Qwen-72B-Instruct เคยติดอันดับต้น ๆ ในการจัดอันดับโมเดลโอเพ่นซอร์สที่ดีที่สุดของโลก
การพัฒนาอย่างรวดเร็วของโมเดล AI ในจีนแสดงให้เห็นว่าช่องว่างระหว่างโมเดลจากจีนและสหรัฐฯ กำลังแคบลง ตามการรายงานของแพลตฟอร์ม SuperClue ที่ประเมินโมเดลตามความสามารถในการคำนวณ เหตุผลทางตรรกะ และการเขียนโค้ด