• 🚀 Đăng ký ngay để không bỏ lỡ những nội dung chất lượng! 💯 Hoàn toàn miễn phí!

Mẽo và Khựa thi xem thằng nào spam AI culi giá rẻ hơn: Tái tạo được công nghệ cốt lõi của DeepSeek chỉ với 30 USD

  • Tạo bởi Tạo bởi awer
  • Start date Start date

awer

Bò lái xe

Nhóm nghiên cứu sinh đã gây chấn động giới AI (trí tuệ nhân tạo) khi tái tạo công nghệ DeepSeek chỉ với 30 USD.​


Theo BGR, một nhóm nghiên cứu sinh tại Đại học California, Berkeley (Mỹ) vừa khiến giới công nghệ 'choáng váng' khi công bố tái tạo thành công công nghệ cốt lõi của DeepSeek - mô hình AI đang gây sốt - với chi phí chỉ 30 USD.

Công nghệ cốt lõi của DeepSeek được tái tạo với phí 'rẻ bèo'

Thông tin này được công bố bởi Jiayi Pan, nghiên cứu sinh tiến sĩ dẫn đầu nhóm nghiên cứu, trên nền tảng Nitter. Theo đó, nhóm đã sử dụng mô hình ngôn ngữ nhỏ, chỉ 3 tỉ tham số, để sao chép khả năng học hỏi tăng cường của DeepSeek R1-Zero. Điều đáng nói là mô hình này vẫn thể hiện được khả năng tự xác minh và tìm kiếm - những tính năng then chốt giúp DeepSeek tinh chỉnh phản hồi của mình.

Tái tạo được công nghệ cốt lõi của DeepSeek chỉ với 30 USD- Ảnh 1.
Công nghệ cốt lõi của DeepSeek được tái tạo chỉ với 30 USD

ẢNH: CHỤP MÀN HÌNH CNBC
Để thử nghiệm, nhóm nghiên cứu đã cho mô hình 'chơi' trò chơi Countdown - một dạng câu đố số học. Ban đầu, mô hình đưa ra các đáp án ngẫu nhiên, nhưng sau quá trình học tăng cường, nó đã tự điều chỉnh và đưa ra đáp án chính xác. Thậm chí, khi đối mặt với phép nhân phức tạp, mô hình còn tự phân tích và giải quyết theo cách tương tự như con người.

Điều khiến giới công nghệ bất ngờ là chi phí tái tạo DeepSeek rất rẻ - chỉ 30 USD. Con số này quá nhỏ so với hàng tỉ USD mà các 'ông lớn' như OpenAI, Google hay Microsoft đang chi cho việc phát triển AI. Nghiên cứu này cho thấy rằng, việc phát triển các mô hình AI mạnh mẽ không nhất thiết phải đi kèm với ngân sách khổng lồ.

Tuy nhiên, cũng có những ý kiến hoài nghi về tính xác thực của các tuyên bố từ DeepSeek, đặc biệt là về chi phí huấn luyện mô hình. Nhà nghiên cứu AI Nathan Lambert đặt câu hỏi về việc liệu con số 5 triệu USD mà DeepSeek công bố có thực sự phản ánh đầy đủ chi phí hay không, đồng thời chỉ ra những lo ngại về việc DeepSeek chuyển dữ liệu về Trung Quốc.

Dù còn nhiều tranh cãi, nghiên cứu của nhóm Berkeley đã chứng minh rằng, việc học tăng cường tiên tiến có thể đạt được mà không cần đến những khoản đầu tư khổng lồ. Điều này có thể sẽ tạo ra một cuộc cách mạng trong lĩnh vực AI, giúp các công ty nhỏ và các nhà nghiên cứu độc lập có thể tham gia vào cuộc đua công nghệ này.
 
Điều khiến giới công nghệ bất ngờ là chi phí tái tạo DeepSeek rất rẻ - chỉ 30 USD. Con số này quá nhỏ so với hàng tỉ USD mà các 'ông lớn' như OpenAI, Google hay Microsoft đang chi cho việc phát triển AI. Nghiên cứu này cho thấy rằng, việc phát triển các mô hình AI mạnh mẽ không nhất thiết phải đi kèm với ngân sách khổng lồ.

Đúng xạo loz, giống kiểu GT730 DDR3 cũng chỉ ngang RTX 5090
 
bắt đầu xàm Lồn -_- kiểu bị sốc với bọn Tàu quá, nên lồng lên làm chuyện điên rồ à.
con AI mà k có hệ thống dữ liệu thì ăn Lồn à mà 30 đô
 
bắt đầu xàm lồn -_- kiểu bị sốc với bọn Tàu quá, nên lồng lên làm chuyện điên rồ à.
con AI mà k có hệ thống dữ liệu thì ăn lồn à mà 30 đô
Đua tới ko đc thì đua lui.
Quay về xe xăng.
Chống AI, vì AI có thể gây ra thế chiến vs người...
Cấm tự do thương mại, bắt đặt máy chủ ở nước sở tại, kiểm duyệt ...
Thấy hơi phèn
 
Tụi mày đọc báo đừng để tụi nó dắt mũi. Ý của đám nghiên cứu đó là nó thử dùng cách tiếp cận (training) AI theo đúng trong research paper của tụi DeepSeek, và nó thử trên mô hình 3B (là mô hình nhỏ, chạy trên máy tính của tao cũng dc). Thì cho kết quả khả quan tốt ko kém gì những con tuy 3B nhưng phải bỏ tiền tỉ ra training.

Chứng tỏ là tụi DeepSeek đéo có xạo Lồn với paper của tụi nó. Đám báo viết tái tạo công nghệ nghe ngu lồn bỏ mẹ
 
Tụi mày đọc báo đừng để tụi nó dắt mũi. Ý của đám nghiên cứu đó là nó thử dùng cách tiếp cận (training) AI theo đúng trong research paper của tụi DeepSeek, và nó thử trên mô hình 3B (là mô hình nhỏ, chạy trên máy tính của tao cũng dc). Thì cho kết quả khả quan tốt ko kém gì những con tuy 3B nhưng phải bỏ tiền tỉ ra training.

Chứng tỏ là tụi DeepSeek đéo có xạo lồn với paper của tụi nó. Đám báo viết tái tạo công nghệ nghe ngu lồn bỏ mẹ
Tây lông hú vía vì giá của Tàu.
Tiếp theo là con bài an ninh quốc gia, ăn cắp trí tuệ...
Cái ISO là thứ mà phương Tây sinh ra để thống trị nền công kỹ nghệ toàn cầu.
Chiến tranh thương mại còn dài dài.
 
bắt đầu xàm lồn -_- kiểu bị sốc với bọn Tàu quá, nên lồng lên làm chuyện điên rồ à.
con AI mà k có hệ thống dữ liệu thì ăn lồn à mà 30 đô

Lâý model cũ rồi fine tune.
Fine tune mấy cái LLM này thì mày có cỡ vài chục sample là OK rồi.
30 đô la thì tao đoán là tầm vài vạn sample.

Khi nào cần fine tune?
Ví dụ như trong case call center. Mày muốn con AI trả lời giống nhân viên. Thì mày dùng đống data answer của nhân viên để fine tune. Vậy là con Ai vẫn khôn như vậy. Nhưng nó còn biết thêm cách trả lời sao cho giống bọn nhân viên
 
Bọn mỹ rục rịch cấm rồi lmao sẽ luôn có 1 thằng ấn độ giỏi hơn bạn, và 1 sản phẩm tàu rẻ hơn của bạn
 
Lâý model cũ rồi fine tune.
Fine tune mấy cái LLM này thì mày có cỡ vài chục sample là OK rồi.
30 đô la thì tao đoán là tầm vài vạn sample.

Khi nào cần fine tune?
Ví dụ như trong case call center. Mày muốn con AI trả lời giống nhân viên. Thì mày dùng đống data answer của nhân viên để fine tune. Vậy là con Ai vẫn khôn như vậy. Nhưng nó còn biết thêm cách trả lời sao cho giống bọn nhân viên
đéo đủ năng lực để diễn giải 1 vấn đề bằng tiếng mẹ đẻ, thì mày đéo hiểu gì về vấn đề đó đâu. nhìn nhức cả mắt.
 
đéo đủ năng lực để diễn giải 1 vấn đề bằng tiếng mẹ đẻ, thì mày đéo hiểu gì về vấn đề đó đâu. nhìn nhức cả mắt.
Tiếng mẹ đẻ đâu có khái niệm : fine tune , call center, LLM đâu mày.
Dùng tiếng Anh sẽ đủ ý dễ hiểu
 
Top