__#歡喜就好
舊文)中文地址資訊正規化 (thinking)
用Google Refine + Google Map API 正規化台灣地址

對電腦而言:台 != 臺
小傷~*
這個痛苦......數字轉中文;中文轉數字、100-1號;100號之1、5樓;5F.......光是轉換這些東西就累死人......
__#歡喜就好
我這裡一堆只有路名,沒有鄉鎮市區的 XD
小傷~*
沒有標村里鄰就算了,沒標鄉鎮市區是哪招!!?
__#歡喜就好
以前有整理一些狀況:
1. 打錯字:
溪洲鄉❎ 溪州鄉☑
鹿竹區❎ 盧竹區❎ 蘆竹區☑
盧州區❎ 蘆洲區☑
亀山區❎ 龜山區☑
2. 硬要塞:
臺中市中區市❎ 臺中市中區☑
嘉義市東區市❎ 嘉義市東區☑
__#歡喜就好
3. 地理知識:
臺北市淡水區❎ 新北市淡水區☑
新竹縣新豐區❎ 新竹縣新豐鄉☑
4. 改制或舊稱:
彰化縣員林鎮❎ 彰化縣員林市☑
不過還有很多奇怪的例外,用程式處理真的很麻煩
小傷~*
不算太難,只是非常花時間......
載入新的回覆