股癌EP518 | 🌴【中國 DeepSeek-V3模型】

by 艾瑪 – 最後更新日期: 2025-01-06

艾瑪摘錄:龍與地下城 / 中國 DeepSeek-V3模型 / 癌大觀點

熱烈歡迎隨意點幾個廣告支持~
艾瑪會更有動力寫快一點哈哈哈 (((o(゚▽゚)o)))

龍與地下城

聽眾留言推薦,癌大去看覺得好看!

中國 DeepSeek-V3模型

DeepSeek 在大約 2 個月內,使用專為中國市場設計的 NVIDIA H800 GPU 訓練 DeepSeek-V3,更宣稱只花 557 萬美元完成訓練,相比 Meta 訓練 Llama 3.1 估計投資超過 5 億美元,DeepSeek 的技術大幅省下成本。

資料來源:訓練成本不到 600 萬美元,中國 AI 公司開源 DeepSeek-V3 新模型(2024.12.30)

  • 簡單一句:訓練出GPT-4o大概是要1億美金,而未來4~5年若要做出頂級的AI模型,大概需要投資1000億美元,中國老鐵做出DeepSeek模型只要600萬美金 ^^

設計師椅 VS. 佛山工廠椅 ➡️ 大部分消費者會選佛山工廠的椅子

  • 對於市場影響大,而且影響長遠 ➡️ 可能是第一槍
  • 若證明「便宜實惠」,成本能壓很低的話 ➡️ 超有競爭力,會對科技巨頭造成價格壓力
  • 若中國有很便宜的成本做出來,有可能會促使美國去檢討自己為什麼要花那麼多 capex ?
    ➡️ 這讓癌大提早進入警戒狀態
  • 確實可以用相對便宜的價格做出LLM
  • H800 雖是降規產品,但只是用硬體封了一些線路來達成「降規」
    故「推論」這塊中國未必輸美國很多,但「訓練」這塊因為會差很多(因為H100是900G per second ,H800 是 400G per second )
  • 回到「理性的現實世界」其實對我們影響不會太大,因為很難想像有人敢把所有的東西都丟到中國去做
    ➡️ 橫向的競爭大概不會看到,科技巨頭應該還是會繼續砸大錢推出酷東西
  • 只是做股票必須隨時關注市場情緒,所以會針對這個事情來做停看聽
    絕對不要低估對手,抄一抄搞不好有天會變成大哥

NVLink 是 NVIDIA 開發的一種高速互聯技術,主要用於多個 GPU 之間的直接通信,解決傳統 PCIe 通道的速度限制問題。它提供更高的帶寬、更低的延遲以及更高效的數據傳輸,特別適合需要大量數據處理的應用場景,比如深度學習、人工智慧(AI)、科學計算和大型 3D 渲染。

NVLink 的主要特點:

  1. 高帶寬:比 PCIe 提供更高的數據傳輸速度。例如,NVLink 的速度可以達到 25GB/s 或更高。
  2. 低延遲:減少 GPU 之間傳遞數據的延遲,提升處理效能。
  3. 多 GPU 支持:允許多個 GPU 串聯運行,資源共享更加高效。
  4. 更大的內存訪問:多個 GPU 可以直接共享內存,避免將數據傳回 CPU,提升處理效率。

NVLink 的應用範圍:

  • 高效能運算(HPC):處理大規模科學計算、天氣預測等。
  • AI 和深度學習:加速神經網絡訓練和推論過程。
  • 影像處理和渲染:處理複雜的 3D 模型和高解析度影像。

例如,搭載 NVIDIA A100 GPU 的伺服器通常支持 NVLink,允許多個 GPU 高效協作,用於深度學習模型訓練。

本集乾爹 – Honeywell 太空人 RO 濾淨瞬熱飲水機

■ 登月「航太級」淨水實力:與NASA太空人合作逾60年

■ NSF生飲級認證:可直接加自來水變RO飲用水

■ UVC循環殺菌:滅菌率99.99%的第二道防護

■ 超高80%淨水比:減少RO廢水4~16倍

■ 免安裝插電即用:省去鑽孔拉線的麻煩

■ 每年只需一支濾芯:替換方便又環保

■ 自動清洗保養管線:預防水垢不怕異味

■ 4段水量觸控:取水方便又直覺

■ 節能省電又安全:比一級能效開飲機省電97%

很開心用文字與你相遇 ❤️ ━( ิ◕㉨◕ ิ)━
如果您覺得艾瑪的筆記還不錯,可以隨意點幾個廣告支持呦!

歡迎留言給我,也可以來艾瑪的粉專按個👍
對我會有很大的幫助,會更有動力寫下去哦!因為您的鼓勵對我來說非!常!重!要! 謝謝你們 😊

FB  ➡️  艾瑪筆記

IG  ➡️ 艾瑪筆記

耳朵懷孕一鍵愛上主委

EP518 | 🌴 ➡️ podcast
EP518 | 🌴 ➡️ youtube

艾瑪筆記

一點育兒

超優質百元開架

一起變漂漂

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *