地政總署數據 · 108 個地區 · Jieba 斷詞引擎

AutoTMS
地址標準化引擎

專為香港物流、外賣、電商場景設計。將客戶手寫、掃描、自填的任意格式地址, 轉化為標準化結構化地址,並附上地理座標。

<200ms(快取 <10ms)
108 區覆蓋
REST API
HK$0.1/ 次
1,000 次 = HK$10010,000 次 = HK$800 8折100,000 次 = HK$7,000 7折
用幾多俾幾多 · 冇月費 · 冇隱藏收費

THE PROBLEM

香港地址有幾混亂?

同一個地方,客戶手寫、掃描、口述出嚟嘅地址千奇百怪

問題類型
客戶輸入例子
系統處理方式
中英混雜
G/F 九龍灣國際展貿中心
雙語並行解析
同音異字
彎仔 · 鴨俐洲 · 谷亭街
同音字映射表自動糾正
俗名縮寫
APM · IFC · YOHO
別名詞典替換為官方名稱
簡稱地名
官塘 · 南昌 · 大角咀
地區容錯規則 + 相鄰容忍
內地/澳門地址
廣州市天河區…
自動過濾,拒絕解析
不完整地址
旺角朗豪坊(無街道)
從數據庫補全完整地址
數字格式
三十二號 · A · 123
中文數字轉換 + 全形轉半形

CAPABILITIES

八大核心解析能力

基於 Jieba 斷詞引擎 + 地政總署地址詞典 + 自建容錯規則

中英雙語解析

同時支援純中文、純英文及中英混雜格式輸入。Jieba 中文斷詞引擎搭配地政總署雙語地址詞典,精準拆解複雜格式。

G/F 九龍灣國際展貿中心
觀塘區 · 展貿徑1號 · 九龍灣國際展貿中心 · 地下

同音字自動糾正

內建同音字映射表,自動識別及修正香港街道及地區名稱中的常見同音異字錯誤。

彎仔 · 鴨俐洲 · 谷亭街 · 提頓街
灣仔 · 鴨脷洲 · 穀亭街 · 堤頓街

俗名 / 別名替換

內建商業大廈及地標的別名詞典,將客戶常用的縮寫及俗名自動替換為地政總署官方名稱。

APM · IFC · YOHO · ICC
創紀之城5期 · 國際金融中心 · Yoho Town · 環球貿易廣場

108 地區智能歸類

覆蓋全港 108 個地區,每個地區設有 acceptDistrict 相鄰容忍機制,即使地址跨越行政分界仍能正確歸類。

大角咀 → 旺角區 · 黃竹坑 → 香港仔
南昌 → 深水埗 · 官塘 → 觀塘

全形轉半形 / 數字轉換

自動將全形字符轉為半形,將中文數字轉為阿拉伯數字,處理門牌號範圍取中間值匹配。

A · 123 · 三十二號 · 1-5號
A · 123 · 32號 · 3號(取中間值)

非港地址過濾

自動識別內地省市縣格式及澳門地址關鍵字(氹仔、路環等),拒絕解析非香港地址並返回空結果。

廣州市天河區… · 澳門氹仔…
標記為「非港地址」→ 拒絕解析

多維度評分比對

對候選地址進行街道匹配、門牌號範圍、大廈名稱相似度、地區正確性、地理距離加權等多維度評分。

多個候選結果
Confidence Score 0-10 → 最高分候選

Jieba 中文斷詞引擎

使用 @node-rs/jieba(Rust 加速版)搭配三個自訂詞典:街道索引、屋苑名稱、地政總署地址,將地址拆分為結構化組件。

一段連續地址文字
district / street / streetNumber / building / block / floor / unit

LIVE EXAMPLES

39 個地址解析實例

涵蓋住宅、商業、英文、混合、同音字糾正、鄉村七大類別

私人屋苑、公共屋邨、單幢樓等住宅地址解析

Parsed Result

district

觀塘區

subDistrict

觀塘

street

巧明街

streetNumber

111-113號

building

富利廣場

floor

9樓

unit

C室

lat, lng

22.3113, 114.2264

查看 JSON Response
{
  "result": {
    "district": "觀塘",
    "street": "巧明街",
    "streetNumber": "111-113",
    "building": "富利廣場",
    "floor": "9",
    "unit": "C室",
    "lat": 22.3113,
    "lng": 114.2264,
    "score": 9.8
  }
}

ARCHITECTURE

地址解析流程

四階段串聯處理,從原始輸入到標準化結構化輸出

STEP 01

前處理 QueryHelper

全形轉半形、別名替換(APM → 創紀之城5期)、樓層資訊提取、中文數字轉換(三十二號 → 32號)、門牌號範圍處理。

Regex · 別名詞典 · 同音字映射表
STEP 02

斷詞 JiebaTokenizer

使用 @node-rs/jieba(Rust 加速版)搭配街道索引、屋苑名稱、地政總署地址三個自訂詞典,將地址拆分為結構化 Token。

@node-rs/jieba · 自訂詞典 ×3
STEP 03

搜尋 searchAddressProfile

地區識別(108 區 + acceptDistrict 容忍)→ 街道索引比對 → 屋苑群組比對 → 字串相似度評分 → 地理距離加權排序。

Dice Coefficient · Haversine
STEP 04

輸出標準化結果

返回評分最高的候選地址及座標(Lat/Lng),附帶 0-10 信心評分。結果寫入 Redis 快取加速重複查詢。

Redis 快取 · Score 0-10

DATA SOURCES

數據來源

以地政總署地址資料庫為核心,搭配多個自建索引及容錯詞典

核心數據

地政總署地址資料庫

Land Registry OneLineAddresses — 系統核心數據來源。涵蓋全港已登記街道地址、屋苑、大廈及地段資訊。系統啟動時載入記憶體建立倒排索引。

自建索引

街道索引詞典

street-index.json — 全港街道名稱詞典,用於 Jieba 自訂詞典及街道比對,涵蓋中英文官方街名。

自建索引

屋苑 / 大廈群組詞典

building-groups.json — 香港主要屋苑及大廈名稱群組資料,支持座數、期數、別名等複合結構比對。

自建索引

地區對應表 (108 區)

district_mapping — 全港 108 個地區的中英文名稱、中心坐標、acceptDistrict 相鄰容忍陣列。

自建索引

同音字映射表

street-homophone-map.json — 香港街道及地名常見同音異字映射(灣/彎、脷/俐、穀/谷 等),用於斷詞前糾正。

自建索引

別名詞典

商業大廈、地標、屋苑的俗名及縮寫映射(APM → 創紀之城5期、IFC → 國際金融中心 等)。

TECHNICAL SPECS

技術規格

<200ms
單次查詢回應
快取命中 <10ms
108 區
覆蓋地區
港九新界離島
千筆/分鐘
批量處理
CSV 批量模式
0-10 分
評分範圍
信心評分
Redis
快取系統
重複查詢加速
Jieba
斷詞引擎
@node-rs/jieba (Rust)
Worker 架構
水平擴展
分散式計算
定期同步
資料更新
地政總署數據

API & PRICING

REST API 即刻接入

簡單 GET request 即可獲取標準化結果。支援 /cal(直接計算)及 /get(Redis 快取加速)兩個端點。

GET /cal — 直接計算,適合批量處理
GET /get — Redis 快取,重複查詢 <10ms
GET /geocoder/debug — 完整解析過程除錯
GET /geocoder/tokenize — 查看斷詞結果
批量 CSV 模式:萬筆地址分鐘級完成
Worker 分散式架構,支援水平擴展

定價方案

Pay-as-you-go
HK$0.1/ 每次調用

大量使用自動享有折扣

1,000 次

HK$100

原價

10,000 次

HK$800

8 折優惠

100,000 次

HK$7,000

7 折優惠

大量使用

聯絡報價

專屬折扣

# 單一地址標準化
curl -X GET \
  "https://api.autotms.com.hk/cal?address=APM%20觀塘道" \
  -H "Authorization: Bearer YOUR_API_KEY"

# 含快取的查詢(重複查詢自動命中 Redis)
curl -X GET \
  "https://api.autotms.com.hk/get?address=觀塘巧明街111號富利廣場9樓C室" \
  -H "Authorization: Bearer YOUR_API_KEY"
Response200 OK · 45ms
{
  "result": {
    "district": "觀塘",
    "street": "觀塘道",
    "streetNumber": "418",
    "building": "創紀之城5期",
    "floor": "12",
    "unit": null,
    "lat": 22.3126,
    "lng": 114.2249,
    "score": 8.5
  },
  "corrections": [
    {
      "type": "ALIAS_REPLACED",
      "from": "APM",
      "to": "創紀之城5期"
    }
  ]
}

USE CASES

適用場景

物流送貨、外賣配送、電商結帳、CRM 清洗——任何需要處理香港地址嘅場景

物流 & 外賣配送

訂單地址自動清洗標準化,減少因地址錯誤導致的派送失敗。統一格式後按 108 區自動分組排線。

派送失敗率降低 60%

電商結帳

客戶填寫地址實時驗證,在下單時即發現問題。自動補全不完整地址,提升結帳轉換率。

退貨率降低 35%

CRM 數據清洗

批量處理歷史客戶地址,統一格式便於分析。字串相似度比對合併重複客戶記錄。

重複記錄減少 45%

倉儲 & 排線

訂單地址標準化後按地區自動分組,配合 AutoTMS 智能排線引擎優化配送路線。

排線效率提升 80%

金融 KYC / AML

客戶開戶時驗證地址真實性,比對地政總署數據庫確認地址是否存在,符合合規要求。

合規效率提升 80%

地理空間分析

將文字地址批量轉換為經緯度坐標,用於 GIS 熱力圖、服務範圍計算、門店選址等空間分析。

Geocoding 準確率 96%+

客服 / Chatbot

即時解析客戶口述或手打的地址,自動糾正錯字及俗名,減少人工確認來回次數。

客服效率提升 50%

地產平台

樓盤地址標準化及別名映射,以不同名稱搜尋同一物業(APM = 創紀之城5期),提升搜索體驗。

搜索命中率提升 40%

準備好接入 AutoTMS 地址標準化引擎?

免費試用 · 5 分鐘接入 · 即時開始解析

[email protected] · +852 9425 2903