如今,由于人工智能能力的重大飛躍,基于計(jì)算機(jī)視覺(jué)(CV)的技術(shù)已經(jīng)成為許多應(yīng)用程序和設(shè)備的關(guān)鍵功能,包括人們?nèi)粘J褂玫膽?yīng)用。
沒(méi)有計(jì)算機(jī)視覺(jué),人臉識(shí)別生物識(shí)別軟件將無(wú)法存在。自動(dòng)駕駛汽車需要它來(lái)實(shí)現(xiàn)安全駕駛。醫(yī)學(xué)影像分析和機(jī)器人質(zhì)量保證檢查過(guò)程都需要計(jì)算機(jī)視覺(jué)。而我所在的公司Shopic則利用計(jì)算機(jī)視覺(jué)來(lái)識(shí)別放置在購(gòu)物車中的物品。
這些技術(shù)本質(zhì)上利用計(jì)算機(jī)視覺(jué)來(lái)利用視覺(jué)數(shù)據(jù)作為輸入來(lái)自動(dòng)化有用的過(guò)程,系統(tǒng)包括掃描硬件和算法,使機(jī)器能夠分析、處理和從數(shù)字圖像和視頻中提取信息。它嚴(yán)重依賴于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和復(fù)雜的神經(jīng)網(wǎng)絡(luò)。
近幾個(gè)月來(lái),計(jì)算機(jī)視覺(jué)以新的、令人興奮的方式發(fā)展。對(duì)于一些人來(lái)說(shuō),這些變化也令人不安,但我看到這個(gè)領(lǐng)域充滿了潛力和機(jī)會(huì)。以下是我認(rèn)為在現(xiàn)階段和可預(yù)見(jiàn)的未來(lái)將主導(dǎo)該行業(yè)的一些突出趨勢(shì)。
獲取門檻逐漸降低
邊緣云存儲(chǔ)的不斷進(jìn)步導(dǎo)致邊緣設(shè)備(如數(shù)碼相機(jī)和視覺(jué)傳感器)能夠在現(xiàn)場(chǎng)運(yùn)行計(jì)算機(jī)視覺(jué)處理,而不是將其發(fā)送到云端。這將計(jì)算機(jī)視覺(jué)人工智能處理移至邊緣設(shè)備,降低延遲,減少能源和帶寬消耗。Nvidia等公司正在開(kāi)發(fā)邊緣云服務(wù),以改善計(jì)算機(jī)視覺(jué)資源的部署。擺脫昂貴的云處理和存儲(chǔ),降低了采用成本,使CV系統(tǒng)更加可訪問(wèn)和負(fù)擔(dān)得起。轉(zhuǎn)向邊緣處理還提高了計(jì)算機(jī)視覺(jué)應(yīng)用的數(shù)據(jù)隱私,克服了此前困擾許多公司采用的合規(guī)問(wèn)題。
計(jì)算機(jī)視覺(jué)應(yīng)用范圍擴(kuò)大
隨著采用門檻的降低,越來(lái)越多的行業(yè)在越來(lái)越多的用例中實(shí)施計(jì)算機(jī)視覺(jué)。醫(yī)療保健領(lǐng)域是熱衷于采用計(jì)算機(jī)視覺(jué)的領(lǐng)域,計(jì)算機(jī)視覺(jué)可以實(shí)現(xiàn)更準(zhǔn)確的成像診斷和遠(yuǎn)程醫(yī)療服務(wù),并有望實(shí)現(xiàn)機(jī)器人輔助手術(shù)。
我們親眼目睹了零售行業(yè)計(jì)算機(jī)視覺(jué)用例的增長(zhǎng),包括自助購(gòu)物系統(tǒng)和無(wú)人收銀店。自動(dòng)駕駛車輛和道路安全設(shè)備正在采用計(jì)算機(jī)視覺(jué)來(lái)提高安全性,農(nóng)民正在采用計(jì)算機(jī)視覺(jué)進(jìn)行農(nóng)作物監(jiān)測(cè)和病害檢測(cè),vSLAM系統(tǒng)則利用計(jì)算機(jī)視覺(jué)提供更準(zhǔn)確的災(zāi)難救援、天氣預(yù)測(cè)等方面的地圖繪制。
隨著用例的不斷堆疊,計(jì)算機(jī)視覺(jué)市場(chǎng)將擴(kuò)大。Global Data預(yù)測(cè),計(jì)算機(jī)視覺(jué)市場(chǎng)規(guī)模將從2023年的177.3億美元增長(zhǎng)到2026年的303億美元。
系統(tǒng)變得更加復(fù)雜
隨著支撐計(jì)算機(jī)視覺(jué)解決方案的人工智能算法變得更加強(qiáng)大,計(jì)算機(jī)視覺(jué)系統(tǒng)將改善對(duì)物體和人臉的識(shí)別能力。這將使計(jì)算機(jī)視覺(jué)系統(tǒng)能夠更精確地檢測(cè)情緒并跟蹤身體動(dòng)作,為行為洞察和異常檢測(cè)開(kāi)辟新的能力。雖然對(duì)個(gè)人的監(jiān)控具有很大問(wèn)題,并在近年來(lái)受到審查,但匿名化的人群情感分析是符合倫理的應(yīng)用案例之一。
我們還看到計(jì)算機(jī)視覺(jué)系統(tǒng)正在開(kāi)發(fā)創(chuàng)新的圖像處理模型和方法。當(dāng)今的"注意力模型"本質(zhì)上是一種輸入處理技術(shù),使神經(jīng)網(wǎng)絡(luò)能夠?qū)W⒂趶?fù)雜圖像或視頻的特定部分,從而使計(jì)算機(jī)視覺(jué)系統(tǒng)能夠理解繁忙圖像或視頻的每個(gè)部分。此外,"圖神經(jīng)網(wǎng)絡(luò)"將深度學(xué)習(xí)預(yù)測(cè)應(yīng)用于富有關(guān)系的數(shù)據(jù)結(jié)構(gòu),從而增強(qiáng)計(jì)算機(jī)視覺(jué)的能力,理解和解釋上下文。
與其他數(shù)據(jù)源連接視覺(jué)數(shù)據(jù)可以豐富對(duì)事件的整體背景和理解,就像人類將視覺(jué)與風(fēng)的感覺(jué)、速度的感知和環(huán)境背景聲音結(jié)合起來(lái)理解周圍世界一樣。通過(guò)這種方式,CV解決方案可以在更廣泛的背景下理解和提取整個(gè)場(chǎng)景的見(jiàn)解,而不僅僅是選定的片段。
這種成熟將實(shí)現(xiàn)更準(zhǔn)確的解釋和分析,改善決策,在繁忙的制造工廠或城市街道等復(fù)雜和快速變化的情況下發(fā)揮更大的作用。
AR進(jìn)入新時(shí)代
當(dāng)今的增強(qiáng)現(xiàn)實(shí)(AR)解決方案可以產(chǎn)生任何真實(shí)環(huán)境的交互式3D重現(xiàn),并通過(guò)跟蹤平面表面上的變化光線進(jìn)行有限的調(diào)整。它們可以通過(guò)頭部追蹤和控制器對(duì)用戶的動(dòng)作做出響應(yīng),但僅限于此。
然而,計(jì)算機(jī)視覺(jué)攝像頭與眼球追蹤解決方案和陀螺儀的整合開(kāi)始產(chǎn)生更復(fù)雜的系統(tǒng)。增強(qiáng)的計(jì)算機(jī)視覺(jué)(CV-enhanced AR)解決方案可以感知用戶的整個(gè)環(huán)境,引導(dǎo)用戶避開(kāi)障礙物,根據(jù)用戶的身體動(dòng)作調(diào)整虛擬環(huán)境等。
這對(duì)于殘障輔助設(shè)備、導(dǎo)航應(yīng)用程序和游戲/元宇宙體驗(yàn)具有重要意義。
依然存在挑戰(zhàn)
盡管計(jì)算機(jī)視覺(jué)取得了巨大的發(fā)展,并且前景看好,但該領(lǐng)域的領(lǐng)導(dǎo)者仍然面臨一些挑戰(zhàn)。由于計(jì)算機(jī)視覺(jué)在商業(yè)領(lǐng)域是一個(gè)相對(duì)新的領(lǐng)域,因此在大規(guī)模開(kāi)發(fā)和推廣方面缺乏專家。公司需要提升員工的技能來(lái)滿足這些需求。
作為行業(yè),我們還需要更好地解決與隱私、信任和道德使用相關(guān)的問(wèn)題。關(guān)鍵在于要進(jìn)行嚴(yán)格的數(shù)據(jù)收集,要么完全由用戶選擇參與,要么真正匿名化。計(jì)算機(jī)視覺(jué)系統(tǒng)需要符合不斷演變的隱私法規(guī)和公眾對(duì)隱私的要求。
"對(duì)于人工智能的透明度和可解釋性的要求不斷增加。計(jì)算機(jī)視覺(jué)不能僅僅是一個(gè)黑盒子,但它所依賴的人工智能模型如此復(fù)雜,以至于很難使其可解釋。"負(fù)責(zé)實(shí)施人工智能系統(tǒng)的人將更加努力確保他們能夠解釋決策的制定方式以及使用了哪些信息來(lái)進(jìn)行決策。" Bernard Marr寫道,但隨著計(jì)算機(jī)視覺(jué)變得更加復(fù)雜,挑戰(zhàn)也會(huì)增加。
計(jì)算機(jī)視覺(jué)仍在形成中
與其他人工智能解決方案一樣,計(jì)算機(jī)視覺(jué)以光速前進(jìn),新的方法、應(yīng)用、用例和能力不斷涌現(xiàn)。在如此快速變化的環(huán)境中,很難預(yù)測(cè)未來(lái)會(huì)發(fā)生什么。
盡管仍然存在許多需要克服的挑戰(zhàn),尤其是隱私和道德使用方面的問(wèn)題,但計(jì)算機(jī)視覺(jué)系統(tǒng)有望為眾多行業(yè)提供新的功能,為所有相關(guān)方開(kāi)啟新的機(jī)遇。
2024-06-24 07:48
2024-06-24 07:41
2024-06-19 11:06
2024-06-18 09:56
2024-06-17 08:17
2024-06-15 10:06
2024-06-12 09:28
2024-06-11 09:44
2024-06-10 09:48