Ⅰ 數據分析中數據從哪找
1、簡單、公開的數據集
先分享一些科研機構、企業、政府會開放的一些數據集和一些專業的數據下載網站。這些數據集一般都比較完善、質量相對較高,拿到手數據清洗的工作比較少,適合新手做一些簡單基礎的分析。
中國統計信息網:全國各級政府各年度的國民經濟和社會發展統計信息,部分數據免費
國家統計局:各種民生相關的統計數據,而且所有數據都是免費,而且這個網站的友情鏈接里還有很多其他地方的數據以及國外數據。
2、數據可視化項目數據集
最常見的數據可視化項目就是製作某某地區人均收入區別的信息圖,找數據可視化項目相關的數據集的時候,我們希望數據集盡量“干凈”,減少數據清洗的工作,數據要足夠有趣,能夠支撐起豐富的圖表。
3、數據建模、機器學習的數據集
UCI:UCI是加州大學歐文分校開放的經典數據集,是機器學習領域最有名的數據存儲庫。包含各種數據集,比如經典的泰坦尼克號倖存預測到最新的數據(如空氣質量和GPS軌跡)。
阿里天池:作為國內互聯網龍頭阿里巴巴旗下的大數據競賽網站,提供了很多比賽數據集可以練手,說不定還能順手拿個獎,賺點獎金。