[指南] Google Finance 沒有台股興櫃資料?Google Sheet 試算 ...

文章推薦指數: 80 %
投票人數:10人

近期想使用Google Finance 來自動抓取美股和台股資料的時候,發現缺乏台股興櫃股價的資料。

雖說Google 試算表中的IMPORTHTML 可以方便的爬取資料, ... PrimaryMenu Skiptocontent Search SecondaryMenu Skiptocontent 章節連結 原理 語法 使用方法 如何取得XPATH 近期想使用GoogleFinance來自動抓取美股和台股資料的時候,發現缺乏台股興櫃股價的資料。

雖說Google試算表中的IMPORTHTML可以方便的爬取資料,不過僅限於

      標籤,而許多有提供股價資訊的網站,並不一定會使用這兩類標籤來呈現。

      這時IMPORTXML就可以派上用場。

      原理 IMPORTHTML和IMPORTXML都是利用爬蟲的原理,來抓取網站的資料。

      相較於前者,XML格式提供給程式一套結構化語法,讓其去辨識的該網頁的內容。

      GoogleSheet所提供的IMPORTXML能夠適用的場景更多。

      語法 IMPORTXML(“”,“”) 第一個參數:你的目標解析網址(必填) 第二個參數:XPATH結構,也就是告知爬蟲要抓取哪個區塊的資料 使用方法 情境:若我今天要抓取鉅亨網上的長榮海運(2603)的資料,那麼就在GoogleSheet的表格中輸入: =IMPORTXML(“https://invest.cnyes.com/twstock/tws/6689″,”//*[@id=’_profile-TWG:2603:STOCK’]/div[1]/div[3]/div[1]/div/span”) 如何取得XPATH 難題會出現在:我如何知道XPATH資料?僅需使用瀏覽器的開發人員工具,並用選取工具取得網頁上的元素,按下滑鼠右鍵來取得即可。

      1.進入目標網頁,並點選滑鼠右鍵,找到開發人員工具(如圖中的Inspect,中文版翻譯的話可能為檢查) 2.點選左上角的選取工具,選取畫面中的股價位置 3.工具會帶你到該HTML標籤的元素位置,在位置點選滑鼠右鍵 4.選單內的複製選項內,會有一項為複製XPATH,點選它 5.回到GoogleSheet中,在IMPORTXML語法內輸入網址和貼上剛才複製的XPATH就完成了 日後,只要在網頁結構沒有變化的情況下,都可以用相同的格式來抓取資料。

      按讚加入粉絲團延伸閱讀 [指南]HSBCUS美國匯豐W-8BEN線上表單MDA填寫 [指南]HSBCUS開戶後必作事項 [金融]HSBCUS開戶申請記錄 [指南]HSBCUS美國匯豐W-8BEN附屬表填寫 [金融]台灣房巢MDAC國際商用不動產投資記錄 文章導覽 ←PreviousPreviouspost:[筆記]CodecademyLearnPHP–13Next→Nextpost:[指南]前端自動化開發Gulp+PHP+Browserify Google站內搜尋 GoogleAdsense Blogimove部落格搬家技術服務


    請為這篇文章評分?