谷歌(微博)的兩名工程師開發(fā)出一款名為PlaNet的照片識別系統(tǒng),這個(gè)系統(tǒng)可以通過分析照片上的像素確定照片的拍攝地點(diǎn)。 人們通常很難僅憑肉眼觀察照片上的景物判斷出照片的拍攝地點(diǎn)。例如,這張照片上有著白色的沙灘,人們可能會以為這是在加勒比海的岸邊拍攝
谷歌(微博)的兩名工程師開發(fā)出一款名為PlaNet的照片識別系統(tǒng),這個(gè)系統(tǒng)可以通過分析照片上的像素確定照片的拍攝地點(diǎn)。
人們通常很難僅憑肉眼觀察照片上的景物判斷出照片的拍攝地點(diǎn)。例如,這張照片上有著白色的沙灘,人們可能會以為這是在加勒比海的岸邊拍攝的,但實(shí)際上這張照片是在馬爾代夫拍攝的。
很多人需要通過地標(biāo)性景物比如自由女神像或者馬丘比丘才能判斷照片的拍攝地點(diǎn),但是谷歌的PlaNet系統(tǒng)就不存在這個(gè)問題。雖然它還處于早期開發(fā)階段,但是它的識別能力已經(jīng)相當(dāng)強(qiáng)了。
托比亞斯·韋安德(Tobias Weyand)和詹姆斯·菲爾賓(James Philbin)是谷歌的兩名軟件工程師,他們與開發(fā)員伊利婭·科斯特里科夫(Ilya Kostrikov)一同建立了PlaNet系統(tǒng)。韋安德對《麻省理工科技評論》說:“我們認(rèn)為PlaNet比人有優(yōu)勢,因?yàn)樗娺^的地方比任何人去過的地方都要多,而且還能識別出不同地方的景色的細(xì)微差別,即便是*喜歡旅游、去過很多地方的人也很難看出那些細(xì)微差別。”
韋安德領(lǐng)導(dǎo)的開發(fā)團(tuán)隊(duì)將全世界劃分成一個(gè)網(wǎng)格,這個(gè)網(wǎng)格由26000個(gè)不同大小的方塊組成,各個(gè)方塊的大小由該地點(diǎn)拍攝的照片的數(shù)量決定。每一個(gè)方塊都代表著一個(gè)具體的地理區(qū)域。
然后開發(fā)團(tuán)隊(duì)利用從互聯(lián)網(wǎng)上的搜集到的各地區(qū)的照片建立了一個(gè)數(shù)據(jù)庫,然后整理和歸入對應(yīng)的網(wǎng)格方塊中。整個(gè)系統(tǒng)一共使用了1.26億張照片。
開發(fā)團(tuán)隊(duì)以人腦為模型建立了一個(gè)強(qiáng)大計(jì)算機(jī)系統(tǒng),并從數(shù)據(jù)庫中提取了9100萬張照片來建立核心網(wǎng)絡(luò)。據(jù)
石家莊網(wǎng)站建設(shè)了解,他們希望*終能夠達(dá)到這樣一種效果:將一張照片輸入這個(gè)核心網(wǎng)絡(luò),馬上就能得到照片的拍攝地點(diǎn)或者至少得到*有可能的拍攝地點(diǎn)的列表。
這個(gè)計(jì)算機(jī)系統(tǒng)會將照片與這個(gè)核心網(wǎng)絡(luò)中的照片進(jìn)行比對,然后得出初步的識別結(jié)果,之后再利用數(shù)據(jù)庫中剩余的3400萬張照片對識別結(jié)果進(jìn)行驗(yàn)證,得到*終的識別結(jié)果。
為了測試PlaNet,谷歌開發(fā)團(tuán)隊(duì)從網(wǎng)絡(luò)照片庫Flickr中提取了230萬張帶有地理標(biāo)記的照片,然后讓PlaNet對它們進(jìn)行識別。
韋安德領(lǐng)導(dǎo)的研發(fā)團(tuán)隊(duì)在學(xué)術(shù)報(bào)告中寫道:“PlaNet能夠以街道級精度確定3.6%的照片的拍攝地點(diǎn),如果從城市級精度來說,識別率為10.1%。”
這樣的結(jié)果并不理想,但是PlaNet的表現(xiàn)還是超過了常人。
平均而言,PlaNet判斷的拍攝地點(diǎn)與照片實(shí)際拍攝地點(diǎn)的平均差距在1131.7公里以內(nèi),而10名見多識廣的旅行家判斷的結(jié)果與實(shí)際結(jié)果之間的平均差距在2320.75公里以內(nèi)。
韋安德的團(tuán)隊(duì)寫道:“總的來說,PlaNet在50輪人機(jī)比試中贏了28輪,平均誤差為1131.7公里;人的平均誤差為2320.75公里。這場小規(guī)模的測試表明,PlaNet在識別街景照片拍攝地點(diǎn)的能力上面已經(jīng)超過了常人。”