時間:2024年4月24-26日 上海世博展覽館-北門(博成路)
距離展會開幕
發布時間:2018-01-22
一、人臉識別的商用現狀
1.人臉識別會員系統
任何一種實體經濟,都離不開會員系統。
人臉作為最能代表人身份信息的介質,為無人經濟創造了數據入口。
目前,不少高端店面已把人臉識別集成在店鋪CRM系統,成功打通會員信息。過去,顧客只有在支付時拿出會員卡營業員才能得知身份。這時候,不少零售店有一新需求:能否在顧客入店時,通過AI系統自動識別其身份,隨后通過終端設備提醒服務員:已有VIP會員進入店鋪,并以可視化的形式,提供對方的核心信息與用戶畫像,以便讓服務員提前為特需顧客提供優質的服務。
隨著人臉識別在遠場場景中的成熟,這一構想正在走進現實。
當下,優秀AI公司的靜態人臉識別準確率已經高達99%以上,遠超人眼。但這只是各種環境友好的前提下:如近距、光照良好、攝像頭清晰等等。
而在零售店面屬于動態場景,因此要想用好人臉識別,對攝像頭有一定要求,不過目前市面上很多廠商都能提供滿足要求的高清聯網攝像頭。
以百度人臉識別應用在線下藥店為例,人臉會員識別系統關鍵在于一塊運行Android操作系統的主板,主板會在本地對視頻和圖像進行去重等預處理,然后再上傳到百度的云端服務器進行人臉識別。
之所以在前端先對人臉進行預處理,主要是為了確保人臉信息采集的效率和效果。
在店鋪場景,絕大部分商家的網絡是普通的家庭ADS寬帶網絡,帶寬非常有限,不可能把所有視頻都上傳到云端,也不可能安裝一兩萬元的昂貴設備。將大量智能算法放在前端硬件上實現,可大幅降低云端服務器壓力。
顧客從入店到離店,期間會產生大量視頻和圖像。但系統并不會把每一幀圖像都上傳,而是進行去重處理,可理解為選取一幀優質的、便于識別的人像圖片上傳到云端。
而將“識別”放到后端則是因為會員人臉庫較為龐大,大規模的人臉檢索能力,在云端更快地完成萬級別乃至百萬級別的人臉檢索,并在極短時間內實時反饋識別結果,避免會員人臉信息的增加,對識別速度產生影響。
這種前、后端的組合應用方式既確保了識別效果,又盡可能保障了識別效率。
雖然市面上不少攝像頭廠商的產品可以滿足人臉識別要求的高清度,但會員系統的面臨的挑戰在于,實際應用場景存在各種各樣的復雜環境限制,如現場光照、店內遮擋物、網絡條件、攝像頭角度等,這些都會影響到識別的準確率。
人臉識別的有效范圍則主要取決于可以捕獲到的最小人臉,要兼顧清晰度、姿態、光照等條件限制。考慮到實際的應用場景,這主要取決于攝像頭本身的能力,不同的場景對攝像頭的要求也不盡相同。因此,最終的識別效果,不僅關乎識別技術,還依賴于產品策略。比如,對于強光和夜晚弱光等情況,可以通過調整攝像頭位置,確保不逆光、室內燈光正常來滿足識別條件。
以普通藥店為例,系統一般需要配置3-4個攝像頭,安裝在店鋪入口處,室外1-2個,室內2個。系統識別速度非常快,即使有三五個人同時進店,也只要1-2秒就能全部識別。此外,市場上這類方案同時具備大規模人臉庫搜索能力,可支持龐大的會員人臉庫查詢;具備組件化SDK、接口和配置后臺;同時還支持多攝像頭設備ID配置管理、端人臉圖像輸出推送地址配置、人臉過濾與分析策略配置,方便低成本高效集成。
引入系統后,店家可在會員注冊環節采集會員的人臉信息,形成會員人臉庫。店員征求顧客的同意后,將通過CRM系統的手機客戶端拍攝顧客的人臉照片存儲到后臺。
當顧客再次進店消費時,系統便會實時自動捕獲消費者人臉,調用云端人臉識別接口,與會員人臉庫進行比對,準確識別出會員身份信息,并實時反饋給商家的業務管理系統,實現業務聯動。通過營業助手APP對會員的到訪次數、購買記錄、消費頻率等會員信息快速了解后,在顧客選擇商品時,營業員可以提供更科學更安全的服務。
至于常訪顧客,則由業務方根據業務需要自行設計業務邏輯和產品方案,決定是否存儲人臉圖像等信息。
2.非會員回頭客識別系統
上述內容談到的是對會員識別,當然,除了識別已注冊會員的顧客外,市場上還有部分供應商,會根據過往的未注冊會員的到訪與在某些柜臺停留時長的歷史,為其建立回頭客人臉庫和用戶畫像。當非會員第N次進入該店鋪時,人臉識別系統可從顧客進店就能識別他的過去留下的“歷史”與“個人屬性”。
相比而言,會員識別相對簡單,因為有會員庫,正常抓拍比對即可;但回頭客必須與歷史庫中的海量人臉進行秒級比對,對識別速度和識別準確率均是極其苛嚴的要求。
重點服務長訪客,對于線下實體店鋪從提升銷售額的角度來看,有一關鍵維度:提升客戶轉化率。
3.實體店刷臉支付系統
人臉識別除了可應用在會員識別與回頭客識別系統中外,支付也是極佳的落地場景。
兩年前,馬云第一次在漢諾威電子展的大屏上向全世界演示“刷臉支付”技術,引得滿堂喝彩。當時很多實體商家期待馬上就能使用之際,“刷臉支付”卻遲遲未能走向商用。兩年間,新技術和新概念層出不窮,但“刷臉支付”的最新進展仍然時刻牽動著人們的神經。9月1日,支付寶在肯德基的KPRO餐廳上線刷臉支付,正式將“刷臉支付”推向了商用。
刷臉支付的具體步驟如下:
在自助點餐機上選好餐,進入支付頁面;選擇“支付寶刷臉付”,然后進行人臉識別,大約需要1-2秒;再輸入與賬號綁定的手機號,確認后即可支付。支付過程不到10秒。
已經進行支付寶實名認證的用戶,首次使用“刷臉支付”時,可以直接在支付寶APP上開通該項功能;未進行實名認證的用戶則還需要進行人臉驗證,建立人臉庫信息。
目前,支付寶的“刷臉支付”功能已經能夠應對“多人+濃妝+換發型”的復雜場景。
首先,人臉識別從線上遷移到線下,要突破幾大難點。與“刷臉登錄”相比,“刷臉支付”難度更大。一是支付對安全性要求更高,其次,刷臉支付是在線下公共設備和開放環境下進行,真實場景復雜多變:白天和晚上的光線不同、不同人群面對攝像頭的角度和姿勢各異,識別難度更高。
因此此前行業里多是在特定場景下內測,未能商用。刷臉支付對安全性和便捷性有著極高的要求,如何同時滿足這兩個要求,需要解決一系列技術和產品難題。
這時候必須通過軟硬件的結合,用智能算法與風控體系綜合保證金融級準確性和安全性。
活體檢測的作用
在今年的央視315晚會中,主持人使用專業視頻處理軟件展示合成后的人臉,并通過外部輸入控制合成人臉的抬頭、低頭等動作,成功地對人臉識別進行了破解。因此,確認攝像頭前的人臉是“真人”顯得尤為重要。以肯德基KPro刷臉取款為例,肯德基在點餐機上配備了3D紅外深度攝像頭,在進行人臉識別前,會通過軟硬件結合的方法進行活體檢測,來判斷采集到的人臉是否是照片、視頻或者軟件模擬生成的,能有效避免各種人臉偽造帶來的身份冒用情況。
除此之外,市場上也有專用的紅外雙目攝像頭產品,通過同時采集紅外光和可見光作為輸入數據,通過紅外成像、立體成像檢測、紅外與可見光成像匹配識別,分析人臉皮膚的紋理及微小動作帶來的規律變化,實現人臉識別和活體檢測。
360人工智能研究院院長顏水成博士曾談到,相關技術廠商不僅要關注人臉比對的準確率,在涉及隱私、支付等場景使用時,應當將人臉與聲紋、指紋、虹膜及其他生物認證信號相融合,多個方面同時發力,從而提高安全門檻,保障用戶安全。
目前比較前沿的紅外雙目專用攝像頭解決方案,運用紅外雙目攝像頭,通過同時采集紅外光和可見光作為輸入數據,結合硬件專用的應用驅動功能,通過紅外成像、立體成像檢測、紅外與可見光成像匹配識別,以及其他保密的技術,實現快速活體檢測、人臉識別。綜合近紅外和可見光照進行活體檢測,可以分別進行:紅外照與可見光照比較,立體成像檢測等,活體檢測準確率更高,有效從紅外光,立體成像等多種角度進行活體檢測,并且人臉識別準確率更高,全面解決了視頻、照片、面具等各類攻擊,遠超單可見光、單紅外光的防攻擊技術,總體安全性極高。
手機號校驗的技術出發點
很多人不理解,為什么肯德基刷臉支付在進行人臉識別后,還需要輸入與賬號綁定的手機號進行校驗?僅僅是為了提高了安全性嗎?不止是。
與支付寶相同的是,京東之家的“刷臉支付”也需要輸入手機進行輔助認證,但后者只需要輸入手機號的后四位。
從技術角度講,輸入電話號碼,不僅可增加安全性,同時也增加了準確性。
“刷臉支付”實際上是通過電話號碼將1:N的人臉識別問題轉換成了1:1的人臉識別問題。在1:N的人臉識別場景中,當人臉庫規模達到3000人以上時,對人臉識別算法的識別精度將是一個很大的考驗,而且人臉庫規模越大,難度越大。
輸入全部手機號+人臉識別和刷臉登陸時可看作是1:1識別,不過是先做1:N(識別)再做1:1(識別)。僅輸入手機號后四位,雖然本質也是1:N,但通過手機號后四位將N的范圍縮小。假設有1億用戶,通過手機號后四位可能把N減小到1萬,再通過地域權重,基本可以得到一個比較好的結果。
不少人臉識別廠商稱自己的人臉識別庫容能做到上百萬,實際針對的是1:1人臉識別,即可以做到從百萬人臉庫數據中,先通過身份證、社保卡或者特定賬號從服務器后臺提取指定的人臉信息,將此人臉信息與當前人臉信息比對,判讀“他”是否與該身份證、社保卡或者特定賬號的人臉信息匹配,而不是從百萬人的數據庫里純刷臉識別出“他”是誰。
1:N人臉識別的準確率還要加上先決條件——Top N。因為人臉識別的輸出結果是“相似度”,也就是識別的是一張人臉和另一張人臉的相似程度,而不是“絕對值”。在公安的被動查詢場景中,只要TOP20、TOP50中有一個比較好的準確率就已經表現不錯,實現起來相對容易。而在支付場景中,要實時分析這個人到底是不是賬戶的主人,就要求TOP1有很高的準確率。
提高識別準確率主要有兩種途徑,一是從理論的角度,不斷提升算法;二是從產品和工程的角度,盡量在不打擾用戶的情況下縮小N值。由于“刷臉支付”的誤差率要控制在十萬分之一甚至百萬分之一以下才有商用價值,前者的可行性較低。支付寶和京東采取的都是后一種做法,更多是屬于產品策略上的創新。
二、商品檢測與識別
零售的本質是構建人與貨物的關系,人臉作為人獨一無二的身份信息,在很多環節能為零售起到銷售支持。而商品作為與人在零售場景中產生關系的物體,同樣是智能無人技術需要攻克的地方。
1.基于AI的商品檢測與識別
Amazon Go最大的亮點是顧客拿走或者放回物品的同時,用戶手機里的系統(該系統與Amazon Go商店的信息中樞無延遲地同步進行更新)會自動更新清單,然后用戶直接離開商店即可。
此前亞馬遜提交的兩份核心專利:“偵測物體互動和移動”和“物品從置物設備上的轉移”,就是利用軟硬件,圍繞商品的檢測和識別展開。
一般而言,如果從顧客的角度來判斷購買行為顯然會非常復雜,但從貨架的角度來看就要簡單得多,此時的核心動作只有兩種,即拿走或放回,Amazon Go是如何做到的呢?
首先貨架前的攝像頭會采集用戶手在進入貨架平面前的圖像,當用戶手在貨架上拿上商品離開時,此時的圖像亦會被采集,然后將兩次采集的圖像進行對比,判斷出用戶是拿出貨物還是放入貨物。確認了物品的拿出與放回,這可看作商品檢測環節,其次就是識別:知道哪些商品被拿出或者放回。
對被拿走的商品,可分兩種情況,即物品處于原本所在的位置上,此時商品直接被標識于系統中,只需利用傳感器即可感知到該物品被拿走;當商品與原本位置不一致時(通過圖像識別該位置與現有商品不一致時),盡管Amazon Go系統會對錯放商品進行圖片對比檢索(與數據庫內的圖片進行比較)識別,但Amazon Go此時往往無法很好地對商品進行識別,這是AmazonGo的一個BUG,當然出現這種情況時,Amazon Go會提醒工作人員將商品放回正確的位置了。
最后,Amazon Go內的商品是如何實現與人關聯的?這就需要依靠室內定位技術。Amazon Go定位依靠的是圖像分析以及音頻來實現,首先通過店內的攝像頭檢測用戶及其方位,同時商店貨架或者天花板內的多個音頻根據各聲音時差分析出用戶的位置,此外,用戶手機的GPS以及WIFI信號亦能協助定位的實現。
Amazon Go目前定位上存在一些技術問題,比如較多顧客擁擠在一個區域時,此時的圖像分析會對系統GPU形成高負荷,而其他定位技術亦會因精度問題導致誤差,此時定位的可靠性會大打折扣,這也是后續Amazon需要持續解決的問題。
Amazon Go采用的機器視覺識別、深度學習算法和傳感器融合等技術都是目前最前沿的新興應用技術,Amazon在無人商店領域的技術積累可謂全球領先,但正是這些領先技術的加持,使得Amazon Go造價不菲。據悉,一個Amazon Go可能需要千萬美元級別的投入。
2.基于RFID的商品檢測與識別
目前市場上鮮有能做到像Amazon Go這樣“即拿即走”的購物模式,但這種體驗背后的代價就是超高成本、復雜、容易出錯等問題。相比而言,基于RFID技術的方案相對簡單也更可靠。
市面上不少無人便利店內商品包裝上皆貼有RFID標簽,避免了像Amazon Go那樣需要進行復雜的圖像識別過程,但也可以起到節省人力的作用,不失為向第一類“無人零售店”過渡的一種辦法。
RFID工作原理主要是通過射頻信號自動對目標對象進行自動識別并獲取相應的數據,工作運轉過程全程自動化無需人工干預,是一種非接觸式的自動識別技術。
從概念上講,RFID類似于條形碼技術。條形碼技術是將條形碼信息依附在物品上,通過掃描槍對物品上的條形碼進行掃描,從而獲得物品的信息。而RFID技術將RFID標簽依附在物品上,通過射頻信號將標簽中的信息讀取到RFID讀取器中,從而獲得物品的特有信息。相較于傳統的條形碼,RFID技術優點如下:
快速掃描:RFID辨識器可同時辨識讀取多個RFID標簽,相比之下,條形碼每一次只能有一個條形碼受到掃描。
穿透性和無屏障閱讀:在被覆蓋的情況下,RFID能夠穿透紙張、木材和塑料等非金屬或非透明的材質,并能夠進行穿透性通信。而條形碼掃描機必須在近距離而且沒有物體阻擋的情況下,才可以辨讀條形碼。而“無人零售店”之所以能做到無人收銀,也主要是利用了RFID技術的這一特點。
數據的記憶容量大:一維條形碼的容量是30個字符左右,二維條形碼最大的容量可儲存2至3000字符,RFID最大的容量則有數兆字符,隨著記憶載體的發展,數據容量也有不斷擴大的趨勢。
體積小型化、形狀多樣化:RFID在讀取上并不受尺寸大小與形狀限制,不需為了讀取精確度而配合紙張的固定尺寸和印刷品質,不像條形碼容易產生形變和破損等問題而導致無法識別。此外,RFID標簽更可往小型化與多樣形態發展,以應用于不同產品。
RFID技術相對已經較為成熟,但是RFID信號遇到液體、金屬易衰減屏蔽,黏貼麻煩易被撕毀,尺寸和感應距離難協調,成本也不低。
RFID的四大技術硬傷
RFID方案飽受詬病的就是成本較高。不過近年來,隨著技術發展和應用場景增多,RFID標簽的成本已有所下滑,RFID標簽單個成本約在五角錢左右。
其次是漏讀。在實際體驗過程中,當消費者把所有商品放置在感應區時,商品自然堆積在了一起,此時系統只識別出了四件商品。如果把多件商品均勻攤開,系統這才識別出所有商品。之所以會出現漏讀現象,是因為芯片和天線之間沒有發生接觸。解決的途徑主要有三種:一是提高標簽的靈敏度,降低標簽的最小喚醒功率;二是增加讀寫器的信號強度;三是改善信號場的設置,通過機電協同,避免死角的出現。
少部分商家采用超高頻方案,而絕大部分公司則采用的是高頻方案。相對于其他頻段的RFID技術,超高頻RFID具有一些顯著的技術優勢:
靈敏度高:靈敏度決定了識別的商品的距離。
采集數據的速度最快:高頻和低頻RFID采集數據的速度是以秒為單位計算,而超高頻的識別速率則是毫秒級的,可以帶來更好的用戶體驗。
多標簽的數量:低頻和高頻RFID同時識別的標簽數量局限性較大。
成本低:超高頻RFID標簽的成本要比低頻和高頻低50%甚至更多。前者的起步價為幾毛錢,后者的起步價則為幾塊錢。
但國內擁有成熟超高頻RFID方案的廠商少之又少。
第三是速度。結算完畢后,顧客需要帶著已買單的商品經過一個感應區,感應區會自動識別是否有未支付的商品。如果沒有,系統就會提示顧客推門離開,整個過程耗時約5秒。而隨著顧客購買的商品數增加,即使系統能夠準確識別,耗時也將進一步增加,嚴重影響用戶體驗。
第四是止損。無論對于大型商超還是小型便利店,止損都是一個亙古不變的難題。止損率的輕微浮動對于零售行業來說都是致命的,而無人零售面臨的止損問題更是極為嚴峻。采用RFID方案的無人便利店面臨的止損挑戰主要來源于兩方面:一是顧客惡意損毀RFID標簽;二是顧客刻意屏蔽標簽的信號,比如用手或錫箔紙遮擋標簽。
RFID如何更好的發揮作用?
雖然RFID單一技術并不能解決無人零售場景中的所有問題,但它仍有存在必要,而且擁有許多機器視覺并不具備的優勢,比如實時監測庫存和商品的熱力分布。
未來商業的一大趨勢就是數據的實時化和智能化。RFID實時、精準獲取海量數據的能力,如果能夠結合高效的數據分析系統,就可以為C、B端的協同和供應鏈優化提供有力的數據支撐。
圖像識別或者說商品識別只是無人零售這個新興行業最前置的環節,不代表整個無人便利店的技術體系。繽果盒子目前正在摸索的是無人便利店后端的管理模式,即“高效地進行突破,精準定位到個體”。
多技術混合:多技術融合是未來無人零售解決方案的發展趨勢。
海外有些項目通過一個具有RFID功能的讀取器和帶有商品二維碼的安全扣以及具備自主結賬功能的系統來實現。
首先,顧客把想要買的商品放到專用的讀取器上,讀取器會識別這些物品并將價格和稅款顯示出來;然后,系統會詢問顧客是否想要紙質的小票,或者直接email給他;在顧客付款之后,還要把安全扣放入一個小槽里面來解鎖。如果這是一個已經買過的商品,安全扣則自動被解鎖。
具體場景對應具體方案:即技術的發展必須牢牢貼合實際應用場景。無人便利店是一種全新的零售業態,此前RFID廠商并未有針對性地為這一場景設計產品。未來積累了一定經驗之后,應用RFID方案的無人便利店還有望得到進一步優化。
另外,在某些特殊場景中,RFID技術也能揚長避短,充分發揮其價值。比如應用于很多餐廳的RFID自助結算餐臺。
RFID自助結算餐臺配備了多種色彩的餐具,每一種色彩對應一個價格,碗碟內置RFID標簽供餐臺讀取價格信息進行結算,一小時可以完成上千人次的自助結算,僅需一名操作員站在設備后維持結算秩序即可,大大提高了結算效率。
無人零售對整個行業來說都是一個全新的命題,不管傳統企業還是初創公司都還處于探索階,還在不斷嘗試和驗證各種技術的可行性。小空間的亞馬遜方案可能會再次出來,但是商業化確實很難。RFID方案會被放棄,自助掃碼的方案會存在變種。