在計算機視覺領域中,商湯、曠視、云從、依圖可以說是當之無愧的頭部企業,更是被業內稱為CV(ComputerVision)四小龍。值得關注的是,商湯和云從兩家上市公司都經歷了上市即巔峰,隨即股價下跌的劇情。資本市場表現不佳,深陷裁員等傳聞,不禁讓人好奇:當風口退去,他們準備好面對資本市場最嚴格的審視了嗎?
研發成本高、盈利難:
目前業內將虧損的主要原因歸咎于研發,從招股書顯示,商湯科技2018-2021年上半年,累計虧損242.72億元,調整后累計虧損為28.6億元。商湯科技在研發上十分大手筆。2018-2021年上半年,商湯科技三年半合計研發支出達69.91億元。
云從科技的招股書中也可以看到,2019年-2021年,云從科技三年累計虧損高達23.21億元。造成虧損的一大原因是高額的研發投入占了營收大半,2019年至2021年,云從三年累計研發投入占營收的占比為59.39%。
AI的應用場景中非常分散和碎片化,客戶的每一個新場景都需要企業長期堆人頭、消耗大量的研發與交付資源。無論是云從還是商湯,持續增加的研發投入,卻換來長期虧損,這成為籠罩在AI企業頭頂之上的烏云。
商業化落地難:
翻閱商湯科技公布的2022年上半年財報顯示,公司新增2136項專利,專利資產總數達12502個,在全球頂級計算機視覺會議上發表了71篇論文。可商業并非學術。如何將技術規模化落地到場景中去,并實現商業化變現,對于不少計算機視覺企業來說也是一個難點。
無論是盈利模式還是應用落地,在CV領域外,四小龍的AI之路仍充滿著艱難。
計算機視覺與工業界GAP有多大?
從人臉識別到工業智造,計算機視覺目前已跨越了安防、金融、零售、互聯網、半導體、汽車等不同垂直行業。
隨著數字化轉型需求的提升,越來越多的工業企業開始應用視覺技術替代人工進行工況檢測、成品檢驗、質量控制。“四小龍”在應用場景的落地上雖然都以比較成熟的安防和金融為主,但查看幾家企業的網站發現,已有一些企業開始在工業領域涉足。
例如,曠視推出的河圖就是面向供應鏈物聯網打造的“機器人物聯網操作系統”,重點關注“倉儲、物流、制造和供應鏈”等行業場景。商湯科技在工業質量控制方面更是已有案例,提供了基于SenseCore 商湯AI大裝置打造的光機電軟算一體化的深泉工業質檢推訓平臺解決方案。
碎片化場景難以深入
新市場、新賽道的拓展并不容易。對于計算機視覺企業來說,想要進入工業市場,質檢、巡檢是主要應用場景,但對于工業企業來說,計算機視覺只是繁雜工藝中的一環,要嵌入完整的生產線上,必然會遇到與其他環節合作的挑戰,甚至與工業本身的相互磨合。
一個個“大而全”的解決方案,看似可以破解一切難題,但往往會被現實場景進一步削弱。因此,機器視覺在工業領域的應用需要找到非常有吸引力的差異化場景。
在我們與工業用戶的接觸中,很多用于都有意愿嘗試通過AI機器視覺來解決工業檢測中的問題,但是客戶對技術的成熟度并無概念。視覺算法企業在面對千奇百怪的工業應用場景時,也很難保證用戶可以在一定成本內達到預期效果。
比如在汽車、3C、制藥等行業,他們的共同特點都連續大批量生產、對外觀質量的要求非常高,但三個行業的被測物一致性、對視覺系統的分辨率、對檢測速度的要求來講,都是不盡相同的。
細分到不同的工藝環節,都會造成機器視覺系統所需的機理模型不同。以冶金鋼卷生產缺陷檢測為例,鋼卷分為冷軋、熱軋,都可以采用機器視覺技術進行質檢,但算法要解決的機理問題卻又是完全不一樣。一個企業、一個場景,尚無法做到模型的通用化,而一對一模型的定制開發,又會導致落地成本和實施周期的增加。
從若干客戶的各種具體應用場景中對解決方案進行總結研發,提煉出在一定應用場景下相對普適性的解決方案,并設計有效的機器視覺解決方案,需要大量的行業應用經驗積累。
因此,想在工業場景中拓展智能化應用,光有算法實力是不行的,還必須具備相當深刻的行業知識。對于工業領域來說,不一定需要多復雜的算法,而是更多地受到其他現實因素的影響。他們更注重豐富的行業應用經驗,算法應力求簡單實用,穩定性強。
成熟算法已有
一般來說,掌握底層軟件算法的公司更容易形成自身優勢。但在工業領域,成熟的視覺算法軟件已經有很多,包括vision pro、halcon、opevCV、mil、hexsight、evision、avl等。例如,非常成熟的檢測算法Halcon,經過長期的積累和迭代,不僅非常穩定而且計算量小,還不用標注數據和調參。
在算法側重上,工業視覺的算法往往側重于精確度的提高;而計算機視覺的算法難度相對較高,側重于或采用數學邏輯或采用深度學習方法進行物體的標定與識別。
有系統服務商曾表示,在開發解決方案的時候選擇了某品牌的相機,相機設備自帶一個面向工業視覺的算法庫,買回去之后可以直接開發出更具針對性的產品,部署的時候再買一個品牌的加密狗就可以了,完全沒有必要再去單獨購買一套純算法。既然已經有了這么多可供選擇的算法,工業企業也就完全沒有必要再去選擇純算法公司的產品。
缺乏樣本數據
軟件是機器視覺產業的核心中樞,其背后的本質是數據的積累和算法的迭代。在視覺算法層面,一個最簡單的思路是針對特殊場景收集大量數據去訓練模型。
在工業場景中,數據的收集存在一定問題,樣本數據量往往不足以支持基于深度學習的計算機視覺檢測任務。一般來說,不合格缺陷產品的數量遠遠少于合格品,隨機獲取的數據將存在樣本分布不平衡的問題。而且,工業現場的拍攝環境復雜無法保證,容易造成樣本圖像的質量不一,從而影響后續檢測效果。
機器視覺領域看似繁榮,但是真正落地仍然面臨很多問題。除了軟件算法層面的問題,光源的穩定性、工件位置的穩定性、工件表面質量的穩定性、工件本身的一致性、工件材質、物體的運動速度、光學系統的精度等都是影響視覺技術在工業領域落地的難點。這需要光學,深度學習、傳統圖像算法、機械設備、傳感器等多方面融合。
對于工業用戶來說,合適的硬件及易用的軟件算法固然十分重要,但更重要的是提供軟硬件方案的機器視覺廠商可以根據他們的應用需要和使用場景進行可行性分析,并給出真正適合的解決方案。