เพียงชั่วข้ามคืนที่ DeepSeek สตาร์ทอัพด้าน AI ของ จีน ถูกพูดถึง ก็ทำให้หุ้นบริษัทเทคโนโลยียักษ์ใหญ่ของสหรัฐฯ ร่วงระนาว โดยเฉพาะ NVIDIA ที่ดิ่ง 17% มาร์เก็ตแคปหาย 6 แสนล้านดอลลาร์ อะไรทำ DeepSeek ถึงเป็น ตัวแสบ ที่ทำให้โลก AI เดือดได้ขนาดนี้ ไปหาคำตอบกัน
จุดเริ่มต้นจากเจ้าของกองทุน
ในวันที่บริษัทเทคโนโลยียักษ์ใหญ่ที่ทุ่มเงินมหาศาลในการพัฒนาโมเดลภาษาขนาดใหญ่ (Large Language Model – LLM) เพื่อใช้เป็นโมเดลพื้นฐานการประมวลผลของ Generative AI ไม่ว่าจะเป็น Meta ที่ประกาศลงทุนสูงถึง 6 หมื่นล้านดอลลาร์ Microsoft ลงทุน 8 หมื่นล้านดอลลาร์ แต่จู่ ๆ DeepSeek บริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ (AI) จากประเทศจีนโผล่มา แถมยัง ใช้เงินลงทุนน้อยกว่า แต่ได้ประสิทธิภาพไม่ต่างกัน ทำให้หลายคนมองว่า ตัวแสบ จากจีนกำลังมาแล้ว
สำหรับ DeepSeek ที่ก่อตั้งขึ้นและเป็นเจ้าของโดย เหลียง เหวินเฟิง (Liang Wenfeng) เจ้าของกองทุน High-Flyer ซึ่ง เหวินเฟิง เป็นนักการเงินที่มีความสนใจในด้าน AI อย่างมาก โดยกองทุน High-Flyer ของเขาก็เป็นกองทุนที่ใช้โมเดล Machine Learning ในการวิเคราะห์และซื้อขายหลักทรัพย์ทางการเงิน
ด้วยความสนใจใน AI เหวินเฟิงจึงได้เริ่มต้นโครงการ DeepSeek จากความสนใจส่วนตัว โดยเริ่มจากการซื้อชิป Nvidia จำนวนมากเพื่อสร้างระบบคอมพิวเตอร์สำหรับฝึกโมเดล AI แม้ในตอนแรกเพื่อนร่วมงานจะมองว่าเป็นเพียงงานอดิเรก แต่เหวินเฟิงก็เห็นโอกาสและมุ่งมั่นพัฒนาโครงการนี้จนกลายเป็น DeepSeek ในที่สุด
ทรงพลัง ในต้นทุนที่ถูกกว่า
สิ่งที่ทำให้ DeepSeek กลายเป็นที่จับตาก็คือ เงินลงทุน ในการพัฒนาที่ใช้ น้อยมาก โดยบริษัทชั้นนําของโลกส่วนใหญ่ฝึกแชทบอทด้วยซูเปอร์คอมพิวเตอร์ที่ใช้ชิปมากถึง 16,000 ชิปขึ้นไป แต่วิศวกรของ DeepSeek กล่าวว่า พวกเขาใช้ชิป Nvidia H800 เพียงประมาณ 2,000 ชิป ในการพัฒนาเท่านั้น โดยใช้เงินลงทุนไปเพียง 6 ล้านดอลลาร์
สาเหตุที่ DeepSeek ใช้งบทุนลงทุนที่ต่ำกว่าบริษัทใหญ่ ๆ เนื่องจากบริษัทเลือกใช้ชิปประมวลผลที่ออกแบบมาสำหรับงาน AI โดยเฉพาะ ทำให้ลดต้นทุนได้อย่างมาก ดังนั้น จึงไม่น่าแปลกใจที่หุ้นของ NVIDIA จะได้รับผลกระทบเป็นรายแรก ๆ เพราะถือเป็นบริษัทผู้นำในการผลิตชิปสำหรับ AI
อีกทั้ง DeepSeek ยังใช้เทคนิคการฝึกอบรมโมเดลที่แตกต่างจากบริษัทอื่น ๆ คือการ Mixture of Experts หรือการวิเคราะห์คำถามโดยการทำโมเดลย่อยหลายตัว ที่แต่ละตัวเก่งคนละอย่างมาทำงานร่วมกัน ถ้าเป็นคำถามที่โมเดลไหนตอบได้ก็ตอบ ถ้าตอบไม่ได้ก็ส่งให้โมเดลตัวอื่นที่ถนัดในเรื่องนั้น ๆ ตอบ
นอกจากนี้ DeepSeek ได้เปิดให้ใช้งานโมเดลบางส่วนแบบ Open-Source ซึ่งทำให้ผู้พัฒนาทั่วโลกสามารถนำไปใช้งานและพัฒนาต่อยอดได้
พิสูจน์แล้วว่าไม่แพ้ OpenAI และ Gemini
จากการทดสอบ DeepSeek-V3 พบว่า AI สามารถตอบคําถาม แก้ปัญหาตรรกะ และเขียนโปรแกรมคอมพิวเตอร์ของตัวเองได้อย่างมีประสิทธิภาพเช่นเดียวกับสิ่งที่มีอยู่แล้วในตลาด ตามการทดสอบเกณฑ์มาตรฐาน
อย่างไรก็ตาม ทาง OpenAI กำลังจะเปิดตัว OpenAI o3 ที่มันจะสามารถ คิดและตรวจสอบ คำตอบของตัวเองได้ ก่อนที่จะตอบคำถามผู้ถาม ซึ่งจะช่วยลดความผิดพลาดในการตอบคำถามยาก ๆ ซึ่งผู้เชี่ยวชาญหลายคนชี้ให้เห็นว่า DeepSeek ยังไม่ได้สร้างแบบจําลองการให้เหตุผลตามแนวทางเหล่านี้ ซึ่งถูกมองว่าเป็นอนาคตของ AI
ดังนั้น AI ของจีน ยังไม่แซงสหรัฐฯ แต่อาจจะน่ากังวลในด้านความก้าวนําหน้าระบบ AI แบบ Open-Source ซึ่งอาจทำให้ประเทศจีนสามารถสร้างระบบ AI ที่แข่งขันได้ ได้อย่างรวดเร็วและใช้ต้นทุนไม่สูง
เรียกได้ว่าตลาด AI ไม่ได้ฟาดฟันกันแค่ในกลุ่มบิ๊กเทคฯ ในสหรัฐฯ อีกต่อไปแล้ว แต่กำลังเจอกับคู่แข่งใหม่จากแดนมังกรที่พร้อมจะร่วมมือกับองค์กรต่างๆ เพื่อพัฒนาผลิตภัณฑ์และบริการใหม่ ๆ ที่ใช้เทคโนโลยี AI และแบ่งปันให้ผู้พัฒนาทั่วโลกสามารถนำไปใช้งานและพัฒนาต่อยอดได้