I am LAZY bones ? all linux

2009年 01月 08日 的归档

抓了所有中国手机号段的数据

由于工作需要,我最近要查询大量手机号码的归属地,而本地又没有手机号段-归属地的映射数据,所以随手写了行脚本,运行了N个小时后,终于抓回了166000行的数据.包括13*,151*,1530-1535,155-156,1571,158-159号段的归属地信息.因为据我考查,目前的所有手机号码都应该在以上号段里面,当前的仍在广告中的188和189号段的数据也都还查不到,以后出了,我想我会再更新的.
对了,数据来自手机在线,感谢一下.命令就简单的一行:

for i in `seq 1350000 1350009`; do echo $i `curl -s "http://api.showji.com/Locating/default.aspx?m=$i&output=json&callback=querycallback" | awk -F "[,:\"]+" '{if($9!="PostCode")print $7,$9,$11,$13,$15,$17}'`; done

改一下seq的值就可以得到不同段的结果,但不推荐再大号段地抓数据了,毕竟人家的服务器和流量也是要钱的,如果需要数据的话,从这里下载我抓好的,嘿嘿.