谷歌(微博)的兩名工程師開發出一款名為PlaNet的照片識別系統,這個系統可以通過分析照片上的像素確定照片的拍攝地點。 人們通常很難僅憑肉眼觀察照片上的景物判斷出照片的拍攝地點。例如,這張照片上有著白色的沙灘,人們可能會以為這是在加勒比海的岸邊拍攝
谷歌(微博)的兩名工程師開發出一款名為PlaNet的照片識別系統,這個系統可以通過分析照片上的像素確定照片的拍攝地點。
人們通常很難僅憑肉眼觀察照片上的景物判斷出照片的拍攝地點。例如,這張照片上有著白色的沙灘,人們可能會以為這是在加勒比海的岸邊拍攝的,但實際上這張照片是在馬爾代夫拍攝的。
很多人需要通過地標性景物比如自由女神像或者馬丘比丘才能判斷照片的拍攝地點,但是谷歌的PlaNet系統就不存在這個問題。雖然它還處于早期開發階段,但是它的識別能力已經相當強了。
托比亞斯·韋安德(Tobias Weyand)和詹姆斯·菲爾賓(James Philbin)是谷歌的兩名軟件工程師,他們與開發員伊利婭·科斯特里科夫(Ilya Kostrikov)一同建立了PlaNet系統。韋安德對《麻省理工科技評論》說:“我們認為PlaNet比人有優勢,因為它見過的地方比任何人去過的地方都要多,而且還能識別出不同地方的景色的細微差別,即便是*喜歡旅游、去過很多地方的人也很難看出那些細微差別。”
韋安德領導的開發團隊將全世界劃分成一個網格,這個網格由26000個不同大小的方塊組成,各個方塊的大小由該地點拍攝的照片的數量決定。每一個方塊都代表著一個具體的地理區域。
然后開發團隊利用從互聯網上的搜集到的各地區的照片建立了一個數據庫,然后整理和歸入對應的網格方塊中。整個系統一共使用了1.26億張照片。
開發團隊以人腦為模型建立了一個強大計算機系統,并從數據庫中提取了9100萬張照片來建立核心網絡。據
石家莊網站建設了解,他們希望*終能夠達到這樣一種效果:將一張照片輸入這個核心網絡,馬上就能得到照片的拍攝地點或者至少得到*有可能的拍攝地點的列表。
這個計算機系統會將照片與這個核心網絡中的照片進行比對,然后得出初步的識別結果,之后再利用數據庫中剩余的3400萬張照片對識別結果進行驗證,得到*終的識別結果。
為了測試PlaNet,谷歌開發團隊從網絡照片庫Flickr中提取了230萬張帶有地理標記的照片,然后讓PlaNet對它們進行識別。
韋安德領導的研發團隊在學術報告中寫道:“PlaNet能夠以街道級精度確定3.6%的照片的拍攝地點,如果從城市級精度來說,識別率為10.1%。”
這樣的結果并不理想,但是PlaNet的表現還是超過了常人。
平均而言,PlaNet判斷的拍攝地點與照片實際拍攝地點的平均差距在1131.7公里以內,而10名見多識廣的旅行家判斷的結果與實際結果之間的平均差距在2320.75公里以內。
韋安德的團隊寫道:“總的來說,PlaNet在50輪人機比試中贏了28輪,平均誤差為1131.7公里;人的平均誤差為2320.75公里。這場小規模的測試表明,PlaNet在識別街景照片拍攝地點的能力上面已經超過了常人。”