Python網路爬蟲
大數據擷取、清洗、儲存與分析
王者歸來(第二版)
★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
★★★★★【26個主題】+【400個實例】★★★★★
★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
★★★★★【網路趨勢】+【了解輿情】★★★★★
第二版和第一版做比較,增加下列內容:
★:全書增加約50個程式實例
★:網路趨勢,了解輿情
★:網路關鍵字查詢
★:YouBike資訊
★:國際金融資料查詢
★:博客來圖書排行榜
★:中央氣象局
★:租屋網站
★:生活應用
下列是本書有關網路爬蟲知識的主要內容:
★:認識搜尋引擎與網路爬蟲
★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
★:認識與使用Chrome開發人員環境解析網頁
★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
★:說明lxml模組
★:XPath方法解說
★:css定位網頁元素
★:Cookie觀念
★:自動填寫表單
★:使用IP代理服務與實作
★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
在書籍內容,筆者設計爬蟲程式探索下列相關網站:
☆:國際與國內股市資訊
☆:基金資訊
☆:股市數據
☆:人力銀行
☆:維基網站
☆:主流媒體網站
☆:政府開放數據網站
☆:YouBike服務網站
☆:PTT網站
☆:電影網站
☆:星座網站
☆:小說網站
☆:博客來網站
☆:中央氣象局
☆:露天拍賣網站
☆:httpbin網站
☆:python.org網站
☆:github.com網站
☆:ipstack.com網站API實作
☆:Google API實作
☆:Facebook API實作
探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
★:CSV檔案格式
★:JSON檔案格式
★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
☆:URL編碼與中文網址觀念
☆:將中文儲存
https://youtu.be/aCXqTqqQzVY Gemini 3 x NotebookLM 領軍 Nano Banana Pro x Veo x Whisk x Flow x Gem Google 多模態 AI 工作流 本書內容 ☆★☆從 Gemini...
►►►重量級Claude Code手冊◄◄◄ ►►►涵蓋最新更新Agent Skills內容◄◄◄ ►►►從新手晉升為高手◄◄◄ ★內容介紹 ☆Vibe Coding 時代第一名的 AI 開發助手 Claude ...
NotebookLM筆記術 打造你的AI「第二大腦」 ★☆★ 從「抄重點」走向「理解與輸出」 ★☆★ ★☆★ 多來源整合 x 提問思考 x 知識累積 ★☆★ ★☆★ 學生、教師、上班...
"★★★「程式設計不再孤軍奮戰,讓 AI 成為你的戰友!」★★★ ☆☆☆「用 VS Code + Copilot,讓寫程式變得像聊天一樣簡單!」☆☆☆ ★★★「專案實戰,立即上手,程式...
這不是一本鉅細靡遺的 C# 語法字典。 本書將介紹 C# 語言當中較為核心、進階、或需要花較多時間深度理解的部分。不同於傳統程式設計書籍的是,本書特別強調...
AI Prompt for Excel 用AI提示詞翻轉Excel生產力 【讓AI成為你的Excel智慧助理,創造無限可能!】 【立即入手,跟上數位辦公革命第一線!】
AI提示詞 打造精準Prompt的對話力與創造力 【台灣首創Prompt教戰守則】 【解密AI對話的黃金鑰匙】 【實戰範例,學Prompt超有感】 【職場創新,掌握AI...
AI高效學習術 人工智慧時代學得更聰明 本書內容 ☆★☆在 AI 時代,會學習才是真本事☆★☆ ☆★☆不是學更多,而是學得更聰明☆★☆ ☆★☆讓 AI 當思考教練,而不是...
你與 AI 大神的距離,只差這本「動手做」的實戰指南! 翻開本書,開始打造專屬於你的第一個 AI 應用吧! ★ AI 當你的程式助教,從零開始不怕痛! 本書專...
☆★☆從 Gemini 到 NotebookLM,打造個人知識與創作☆★☆ ☆★☆整合 Google Workspace全系列 AI 工具☆★☆ ☆★☆圖像、語音、影片與文件的多模態☆★☆ ☆★☆讓 AI 真的成...
【本書內容】 ★☆★☆★【技術最強、功能最廣】★☆★☆★ ★☆★☆★【AI助力效率飛躍】★☆★☆★ ★☆★☆★【多執行緒設計效能提升】★☆★☆★
☆★☆★☆ 讓 AI 揭開你的健康真相 ☆★☆★☆ ☆★☆★☆ 每日生活變成你的長壽武器 ☆★☆★☆ ☆★☆★☆ AI 秒做菜單、秒排運動 ☆★☆★☆ ☆★☆★☆ 睡不好?AI 給你最強助眠組合 ☆★☆★☆ ☆...
市面上第一本結合「八字命盤、AI 覺察與人生指引信」的自我探索說明書。 寫給站在人生岔路前、猶豫著該往哪裡走的你, 寫給忙得不敢停下、只能硬撐著往前走的...
★☆★「AI 時代最全面的 ChatGPT 5 實戰指南」★☆★ 在 AI 快速演進的浪潮中,ChatGPT 5 不僅是工具,更是未來工作與創作的強大戰友。本書從基礎到進階,完整揭...
風靡全球UI/UX設計神器Figma 本書精選70個實作技巧,零基礎上手擬真介面設計 了解Figma實戰基礎與進階技巧 認識Figma環境、社群、外掛、延伸學習資源
★★★《AWS自學聖經》作者Sam T.全新作★★★ ★★★圖解教學★★★ ✦什麼是K8S? K8S全名為Kubernetes,是一套容器化管理框架,常與Docker等技術一起運用。近年來...
本書為程式語言 Python 的入門教材,著重於帶領讀者以開發軟體的模式學習 Python 。
★★★★★【內容最紮實、應用最廣】【40個主題】★★★★★ ★★★★★【程式實例最多】【約1280個Python實例】★★★★★ ★★★★★【18大類Python潛在應用】★★★★★ ★★★★★【400個...
展開程式設計師的就業廣告,幾乎都是以Python語言為主流,這本書則是收集國內外各大主流公司的熱門考試主題,Leetcode考題以及筆者認為學習Python應該了解的...
把你腦中的靈感發展成能通過市場考驗的遊戲 你所需要的遊戲製作知識全在這裡! 暢銷大作《戰神》、《小精靈世界》設計師心法傳授 手機遊戲已蔚為風...
Python網路爬蟲
大數據擷取、清洗、儲存與分析
王者歸來(第二版)
★★★本書第一版是【博客來2020年】【電腦書年度暢銷榜第3名】★★★
★★★★★【26個主題】+【400個實例】★★★★★
★★★★★從【零】開始的【網路爬蟲入門書籍】★★★★★
★★★★★大數據【擷取】、【清洗】、【儲存與分析】★★★★★
★★★★★【網路趨勢】+【了解輿情】★★★★★
第二版和第一版做比較,增加下列內容:
★:全書增加約50個程式實例
★:網路趨勢,了解輿情
★:網路關鍵字查詢
★:YouBike資訊
★:國際金融資料查詢
★:博客來圖書排行榜
★:中央氣象局
★:租屋網站
★:生活應用
下列是本書有關網路爬蟲知識的主要內容:
★:認識搜尋引擎與網路爬蟲
★:認識約定成俗的協議robots.txt ★:從零開始解析HTML網頁
★:認識與使用Chrome開發人員環境解析網頁
★:認識Python內建urllib、urllib2模組,同時介紹好用的requests模組
★:說明lxml模組
★:XPath方法解說
★:css定位網頁元素
★:Cookie觀念
★:自動填寫表單
★:使用IP代理服務與實作
★:偵測IP ★:更進一步解說更新的模組Requests-HTML ★:認識適用大型爬蟲框架的Scrapy模組
在書籍內容,筆者設計爬蟲程式探索下列相關網站:
☆:國際與國內股市資訊
☆:基金資訊
☆:股市數據
☆:人力銀行
☆:維基網站
☆:主流媒體網站
☆:政府開放數據網站
☆:YouBike服務網站
☆:PTT網站
☆:電影網站
☆:星座網站
☆:小說網站
☆:博客來網站
☆:中央氣象局
☆:露天拍賣網站
☆:httpbin網站
☆:python.org網站
☆:github.com網站
☆:ipstack.com網站API實作
☆:Google API實作
☆:Facebook API實作
探索網站成功後,筆者也說明下列如何下載或儲存不同資料格式的數據:
★:CSV檔案格式
★:JSON檔案格式
★:XML、Pickle ★:Excel ★:SQLite 在設計爬蟲階段我們可能會碰上一些技術問題,筆者也以實例解決下列相關問題:
☆:URL編碼與中文網址觀念
☆:將中文儲存在JSON格式檔案
☆:亂碼處理
☆:簡體中文在繁體中文Windows環境資料下載與儲存
☆:解析Ajax動態加載網頁,獲得更多頁次資料
☆:使用Chromium瀏覽器協助Ajax動態加載
根據台灣現行法規,數位內容( 如電子書、音樂、影片、遊戲、App )形式之商品,不受「網購服務需提供七日鑑賞期」的限制。為維護您的權益,建議您先使用「試讀」功能後再付款購買。