【雙魚之論】英文拷到 G / D 找中文翻譯
China's technological development has a notable characteristic: it cannot
create groundbreaking theories and products before other nations. However, once
other countries publish these innovations, China quickly competes and excels in
terms of scale and speed.
This raises a critical question: how can a nation, an institution, or even an
individual, without originality or pioneering research, succeed through
"latecomer advantages"?
Such unfair exploitation threatens to disrupt our technological framework and,
ultimately, the foundation of our civilization.
中國的科技發展有一個顯著特點:它無法在其他國家之前創造出突破性的理論和產品。然而,一旦其他國家公開了這些創新,中國便能迅速競爭,並在規模和速度上勝出。
這引發了一個關鍵問題:為什麼一個缺乏原創性和先驅性研究的國家、機構甚至個人,能夠通過「後發優勢」取得成功?
這種不公平的利用行為威脅著我們的科技結構,最終也將動搖我們整體文明的基礎。
中國的新人工智慧模式 DeepSeek 如何威脅美國的主導地位 CNBC 20250124
中國一家鮮為人知的人工智慧實驗室發布的人工智慧模型在整個矽谷引發了恐慌,該模型的性能超越了美國最好的模型,儘管其製造成本更低,晶片性能較差。
該實驗室的名稱是 DeepSeek,它在 12 月底推出了一個免費的開源大型語言模型,據稱該模型 僅用 了兩個月的時間,花費不到600 萬美元就建成了,使用的是Nvidia 的功能較低的H800 晶片。
這些新進展敲響了人們的警鐘:美國在人工智慧領域的全球領先地位是否正在萎縮,並讓人對大型科技公司在建立人工智慧模型和資料中心方面的巨額支出提出質疑。
在一組第三方基準測試中,DeepSeek 的模型表現優於Meta的 Llama 3.1、OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5 的準確度範圍從複雜問題的解決到數學和編碼。
DeepSeek 週一發布了 r1,這是一種推理模型,在許多第三方測試中也優於OpenAI 最新的 o1。
微軟執行長薩蒂亞·納德拉(Satya Nadella) 在世界人工智慧大會上表示:「看到DeepSeek 新模型,他們如何真正有效地完成一個開源模型,進行推理時間計算,並且具有超級計算效率,這令人印象深刻。「我們應該非常非常認真地對待中國的事態發展。」
DeepSeek 還必須應對美國政府對中國實施的嚴格半導體限制,這些限制使中國無法獲得最強大的晶片,例如 Nvidia 的 H100。最新進展表明 DeepSeek 要么找到了繞過規則的方法,要么表明出口管制並不是華盛頓想要的遏制。
Benchmark
普通合夥人 Chetan Puttagunta 表示:「他們可以採用一個非常好的大型模型,並使用一種稱為蒸餾的過程。」「基本上,你使用一個非常大的模型來幫助你的小模型在你希望它變得聰明的事情上變得聰明。這實際上非常划算。
關於實驗室及其創始人梁文峰,人們所知甚少。根據媒體報道, DeepSeek 誕生於一家名為High-Flyer Quant的中國對沖基金,該基金管理約 80 億美元的資產 。
但 DeepSeek 並不是唯一一家取得進展的中國公司。
領先的人工智慧研究員李開復表示, 他的新創公司 01.ai 的培訓成本僅300萬美元。 TikTok 母公司位元組跳動週三 發布了 其模型的更新,聲稱在一項關鍵基準測試中優於 OpenAI 的o1。
Perplexity
執行長阿拉文德·斯里尼瓦斯 (Aravind Srinivas) 表示:「需求是發明之母。」「因為他們必須找出解決方法,所以他們實際上最終構建了更有效率的東西。」
觀看此影片以了解更多資訊。
閹割版ChatGPT、查詢成本大降98%? DeepSeek「火爆洗版」美AI圈
自由 20250127
過去一週,來自中國的DeepSeek(深度求索) R1模型洗版了整個美國AI 圈,美國各大主流網站和社平網站大量探討這間中國神秘的AI公司。據報導,美國強力限制先進科技輸入中國背景下,DeepSeek能以低晶片數開發出與OpenAI O1並肩的新模型,但查詢成本卻便宜了98%,令人驚嘆。
據報導,2025年1月20日DeepSeek發布一款可媲美OpenAI o1的新模型R1後,是以極低的600萬美元(約新台幣1.96億元)製作成本,及僅用2000塊少量晶片就實現了與OpenAI等巨頭相媲美的性能。
業內人士指出,R1與OpenAI o1相比,主要吸引力在於其成本效益。其中,R1模型的查詢成本僅為每百萬token
0.14美元,而OpenAI的費用則為7.5美元,便宜了98%。
這並不是DeepSeek令美國AI圈驚豔的首次。就在2個月前,DeepSeek發布的V3模型免費模型,也僅用558萬美元(約新台幣1.83億元)、遠低於如訓練成本高達7800萬美元(約新台幣25.6億元)的GPT-4。
據報導,1月24日在專業模型排名Arena上,基準測試已升至全類別大模型第三。其中,在風格控制類模型(StyleCtrl)與OpenAI o1 並列第一,競技場得分則略超OpenAI O1的1352分、達1357分。
《CNBC》報導,微軟執行長納德拉(Satya Nadella)在22日在達沃斯世界經濟論壇上表示,DeepSeek的新模型令人印象深刻,不僅因為他們有效地建構一個開源模型,還因為它的推理計算效率極高。納德拉表示,「我們應該非常嚴肅地看待中國的人工智慧(AI)發展」。
AI投資者「modest proposal」一臉問號詢問,「DeepSeek為什麼突然成為主流焦點,導火線是甚麼」?而CNBC也做了一個40分鐘的深度視頻,討論美國AI是不是受到了中國威脅。
《世界報》高級商業編輯Holger Zschäpitz指出,DeepSeek可能對美國股市產生威脅,因為該公司以極低的成本構建了一個突破性的人工智慧模型,並且無需使用尖端晶片,這讓人質疑,投入該行業的數千億美元資本支出的實際效用。
沒有留言:
張貼留言
請網友務必留下一致且可辨識的稱謂
顧及閱讀舒適性,段與段間請空一行