2013年9月13日 星期五

【書籍】Bad Data技術手冊[Bad Data Ji Shu Shou Ce]*電腦資訊類*

Bad Data技術手冊[Bad Data Ji Shu Shou Ce]~推薦!

作者:Q. Ethan McCallum
譯者:吳曜撰
出版社:歐萊禮
出版日期:2013/09/13
語言:繁體中文

定價:480元

ISBN:9789862768952
規格:平裝/264頁/18.5x23cm/普通級/單色印刷/初版
出版地:台灣
本書分類:電腦資訊>資料庫>其他

 ►GO►最新優惠► 【書籍】Bad Data技術手冊

【Introduction】簡介/書評/特色/摘要

  什麼是壞資料?有些人認為它是一個技術性的現象,如遺失值或是格式不對的記錄,但壞資料其實不只如此。資料專家Q. Ethan McCallum邀請了資料領域中,具有不同身分,包含公司執行長、政府官員、科學家、大學教授、程式設計師的19位專家,分享他們處理壞資料問題的方法與心得。

  從有問題的儲存、貧乏的表述到錯誤的政策,造成壞資料有許多的可能。總結來說,壞資料就是會阻礙你的資料。本書提供一些有效的解決方法。

  本書涵蓋許多主題,包括:

  .測試你的資料,來看它是否準備好被用作分析
  .將電子試算表轉換為可被使用的表格
  .處理在文字資料中隱藏的編碼問題
  .開發一個成功的網頁抓取機制
  .使用NLP工具來揭露線上評論的真實情緒
  .提出可能會影響你的分析的雲端運算議題
  .防止會阻礙資料分析的政策
  .使用系統性的方法來分析資料品質

作者簡介:

Q. Ethan McCallum

  Q. Ethan McCallum是一位顧問、作家以及科技狂熱者。他的文章出現在The O’Reilly Network以及Java.net的網站上,著有《C/C++ Users Journal》、《Doctor Dobb’s Journal》等書。他主要的工作,是幫助公司作出對資料以及技術的明智決策。

►GO►最新優惠► 【書籍】Bad Data技術手冊

【Table of Contents】目錄/大綱/內容概要

chapter 01 調整步伐:什麼是壞資料?
chapter 02 是只有我這樣,還是這個資料本身令人感到有趣?
chapter 03 資料是要給人類使用,而非給機器使用
chapter 04 隱藏在純文字中的壞資料
chapter 05 (重新)組織網站的資料
chapter 06 在矛盾的線上評論中偵測謊言以及混亂的狀況
chapter 07 可否請壞資料站出來?
chapter 08 血、汗與尿
chapter 09 當資料與現實並不相符時
chapter 10 偏頗與錯誤的微妙來源
chapter 11 別讓「完美」成為「好」的敵人:壞資料真的壞嗎?
chapter 12 當資料庫攻擊時:何時要堅持使用檔案的導引
chapter 13 臥庫表,藏網路
chapter 14 雲端運算的迷思
chapter 15 資料科學的黑暗面
chapter 16 要如何餵養以及照護你的機器學習專家
chapter 17 資料可追蹤性
chapter 18 社群媒體:可抹除式墨水?
chapter 19 揭開資料品質分析的神秘面紗:瞭解何時你的資料已經夠好了
索引

►GO►最新優惠► 【書籍】Bad Data技術手冊


ISBN:9789862768952
規格:平裝/264頁/18.5x23cm/普通級/單色印刷/初版
出版地:台灣
本書分類:電腦資訊>資料庫>其他

►GO►最新優惠► 【書籍】Bad Data技術手冊

【Preview】內容預覽/連載/試閱PDF下載

►GO►最新優惠► 【書籍】Bad Data技術手冊

ISBN:9789862768952
規格:平裝/264頁/18.5x23cm/普通級/單色印刷/初版
出版地:台灣
本書分類:電腦資訊>資料庫>其他

►GO►最新優惠► 【書籍】Bad Data技術手冊

資料來源:[博客來BOOKS網路書店] http://www.books.com.tw/exep/assp.php/ap/products/0010599297?utm_source=ap&utm_medium=ap-books&utm_content=recommend
圖文屬原創所有。相關資訊僅供參考,歡迎前往選購。發現不妥處請告知!

【Customers Who Bought This Item Also Bought】買的人,也買了...

R 錦囊妙計 網際網路思維企業 | 網路時代下的企業生存之道 精準預測:如何從巨量雜訊中,看出重要的訊息? 架構之美:頂尖架構師於軟體設計中蘊含的智慧結晶 機器學習駭客秘笈 Multi-Device 體驗設計:處理跨裝置使用者體驗的生態系統方法 資料之美:優雅資料解決方案的幕後祕辛 Binary Hacks:駭客秘傳技巧一百招 資料科學的商業運用 測試之美 R 錦囊妙計 機器學習駭客秘笈 Python 錦囊妙計(第三版) 資料之美:優雅資料解決方案的幕後祕辛 深入淺出 Python 


沒有留言:

張貼留言