China Bikin DeepSeek Tantang ChatGPT Amerika, Performa Unggul Berdasarkan Benchmark AI Populer

DeepSeek disebut memiliki performa yang lebih unggul dibandingkan ChatGPT milik OpenAI buatan Amerika

Editor: Joseph Wesly
(DeepSeek)
DeepSeek pesaing ChatGPT dari China. 

TRIBUN TANGERANG.COM- China kini menggebrak di bidang kecerdasan buatan (AI) dengan meluncuekan DeepSeek.

Di lama resminya, DeepSeek menawarkan dua model AI yang memiliki fungsi berbeda, yaitu DeepSeek-V3 dan DeepSeek-R1.

DeepSeek disebut memiliki performa yang lebih unggul dibandingkan ChatGPT milik OpenAI buatan Amerika.

Sebelumnya, OpenAI sudah memiliki banyak kompetitor di bidang kecerdasan buatan (AI) yakni Meta yang membuat model AI Llama 3.1, hingga Anthropic yang menggarap model AI Claude-3.5.  

Namun semua produsen AI tersebut sebagian besar berasal dari Amerika Serikat (AS), negara yang sama seperti OpenAI

Didsebutkan DeepSeek-V3 dirancang untuk membantu pengguna menyelesaikan dan menjawab banyak hal, mulai dari pertanyaan sehari-hari di banyak bidang, hingga tugas kompleks yang melibatkan persoalan matematika dan logika.

DeepSeek V3 merupakan kompetitor GPT-4o.

Sementara itu, DeepSeek-R1 merupakan model AI yang diklaim akan berjalan lebih efisien dibanding model AI lainnya yang ada di pasar.

Dalam website resmi mereka, DeepSeek mengatakan model AI ini bisa bersaing dengan model AI o1 milik OpenAI.  

Di situs web resmi mereka, DeepSeek mengeklaim bahwa dibandingkan dengan beberapa model AI yang ada di pasar, model AI mereka ini unggul dalam sejumlah benchmark AI populer.

Pada benchmark uji coba pemahaman terhadap konteks (DROP, 3-shot F1), misalnya, DeepSeek V3 diklaim memiliki skor performa 91,6 poin, lebih tinggi dari Llama 3.1, Claude 3.5, dan GPT-4o yang masing-masing memiliki skor 88,7, 88,3, dan 83,7 poin.  

Kemudian untuk memecahkan persoalan matematika level internasional macam AIME 2024, MATH-500, hingga CNMO 2024, DeepSeek V3 memiliki skor performa untuk masing-masing benchmark mencapai 39,2, 90,2, dan 43,2 poin.  

Di benchmark serupa, Llama 3.1, Claude-3.5, dan GPT-4o masing-masing memiliki skor performa AIME 2024, MATH-500, dan CNMO 2024 mencapai 23,3, 73,8, dan 6,8 poin, 16,0, 78,3, dan 13,1 poin, dan 9,3, 74,6, dan 10,8 poin.  

DeepSeek juga mengeklaim model AI DeepSeek-R1 mereka lebih unggul dibanding o1 milik OpenAI,di beberapa benchmark pihak ketiga.

Seperti disebutkan di atas, DeepSeek diklaim bisa berjalan dengan efisien dibanding beberapa model AI yang ada di pasar.  

Sumber: Kompas.com
Halaman 1/2
Rekomendasi untuk Anda

Ikuti kami di

Berita Terkini

© 2025 TRIBUNnews.com Network,a subsidiary of KG Media.
All Right Reserved