前段時間可愛的公開資訊觀測站從HTTP改成HTTPS後,有越多越多不利自動化的感覺。
以前偷懶想說可以動就好,用最懶的方式來"更新"資料,現在開始感覺有雞儡,開始改版為XMLHTTP版本。
但首先要研究一下網站,找出真實結點位置,才能發揮程式高速處理得效用,發現結點都在"server-java"的這個小地方。
網站傳遞方式(應該可以這樣說吧)有GET跟POST兩種,哇改為POST了歐,要再進一步找出POST 參數,好險沒有COOKIES,應該還OK。
第一次測試:發現回傳全部都是亂碼,XD
a?oe!‥a?¥a??,e3?a??a1’a??,a??a?﹐a?£e??,a??a?﹐a??c‥±,c?¢a¥-a?¥,c??a¥-a??a?¥-c??a??c??a??,c??a¥-a??a?¥-a﹐?a??c??a??,c??a¥-a??a?¥-a??a1’c??a??c??a??,c??a¥-a??a?¥-a﹐?a??a¯?e??a¢?a﹐?(%),c??a¥-a??a?¥-a??a1’a??a??a¢?a﹐?(%),c’¯e‥?c??a¥-a??a?¥-c??a??c’¯e‥?c??a??,c’¯e‥?c??a¥-a??a?¥-a??a1’c’¯e‥?c??a??,c’¯e‥?c??a¥-a??a?¥-a??a??a¯?e??a¢?a﹐?(%),a??e‥?
"109/03/05","109/2","1235","e??a3°","e£?a??a·¥a¥-","1285","1350","1114","-4.814814814814815","15.350089766606823","2635","2866","-8.060013956734124","-"
"109/03/05","109/2","1256","eRRa’?a??a±?-KY","e£?a??a·¥a¥-","20613","198957","140144","-89.63946983519052","-85.29155725539445","219570","391169","-43.86825131848383","a??a?°a?°a??a??c?€c??a¯?c??a??a?±e??i??e??a??a??ao?e?2c??e|?a±?i??a??a?﹐e??c??a??a·¥a??a?ca·¥a±?a??a?€e?’"
"109/03/05","109/2","1436","e?¯a??e?¯","a?oa??c??e€?","56395","265215","87388","-78.73611975189941","-35.465967867441755","321610","360642","-10.822921345822172","-"
"109/03/05","109/2","1438","e£?e±?","a?oa??c??e€?","0","2","1","-100.0","-100.0","2","3","-33.333333333333336","109a1’c’¯e‥?e?·a?Ra??a??2a??a??,108a1’c’¯e‥?e?·a?Ra??a??3a??a??,a??c??a??eR?a??a?§a€?"
"109/03/05","109/2","1452","aR?c??","c’!c1?co?c?-","146138","114486","140035","27.647048547420646","4.3581961652444035","260624","345186","-24.49751728053861","-"
心中五味陳雜了一下,嘆氣完寫一個簡易轉碼作處理,反正不就是UTF-8或BIG5的差別,多試兩次搂。
出表日期,資料年月,公司代號,公司名稱,產業別,營業收入-當月營收,營業收入-上月營收,營業收入-去年當月營收,營業收入-上月比較增減(%),營業收入-去年同月增減(%),累計營業收入-當月累計營收,累計營業收入-去年累計營收,累計營業收入-前期比較增減(%),備註
"109/03/05","109/2","1235","興泰","食品工業","1285","1350","1114","-4.814814814814815","15.350089766606823","2635","2866","-8.060013956734124","-"
"109/03/05","109/2","1256","鮮活果汁-KY","食品工業","20613","198957","140144","-89.63946983519052","-85.29155725539445","219570","391169","-43.86825131848383","受到新型冠狀病毒疫情影響,配合政府防疫要求,公司運營及工廠復工展延所致"
成功了,剩下的JSON或是逗號分割列出資料,就不聊了。
大概列出來就這樣,未來計畫全數資料庫,比較省事。
打完收工,延伸應用營收資料的部分也要一併修改修改,才能趕上10號的營收更新。