NoSQL,泛指非關系型的數據庫。NoSQL數據庫的產生就是為了解決大規模數據集合多重數據種類帶來的挑戰,尤其是大數據應用難題。
創新互聯公司從2013年開始,是專業互聯網技術服務公司,擁有項目網站設計制作、網站制作網站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元蘭坪做網站,已為上家服務,為蘭坪各地企業和個人服務,聯系電話:028-86922220
雖然關系型數據庫系統RDBMS在安裝和使用上仍然占有主要地位,但毋庸置疑,非關系型數據庫NoSQL技術已經成為今天發展最快的數據庫技術。
NoSQL詳解:如何找到對的技術
NoSQL是對數據庫系統的總稱,在某種程度上,它的性能和用途可能完全不同。NoSQL一詞最早產生于上世紀九十年代,意思是NoSQL(沒有SQL語言),后來隨著時間和技術的發展,SQL界面仍然作為處理數據的方式存在,所以NoSQL又有了新的詮釋,即NotOnlySQL(不只是SQL語言)。今天,NoSQL數據庫憑借著其非關系型、分布式、開源和橫向擴展等優勢,被認為是下一代數據庫產品。
四種主要的NoSQL數據庫和它們主要的應用場景
鍵值數據庫:當數據以鍵的形式訪問時,比如通過國際標準書號ISBN找一本書,鍵值數據庫是最理想的。在這里,ISBN是鍵,書籍的其他信息就是值。必須知道鍵才能查詢,不過值是一堆無意義的數據,讀取之后必須經過翻譯。
文檔存儲數據庫:該數據庫以文檔的形式管理和存儲數據。有點類似于鍵值數據庫,但文檔數據庫中的數據有結構。與鍵值數據庫中值是一堆無意義的數據不同,文檔數據庫中數據以文檔的結構被描述,典型的是JavaScriptObjectNotation(JSON)或XML.文檔存儲數據庫中的數據可以通過定義的任何模式進行查詢,但鍵值數據庫只能通過它的鍵進行查詢。
數據科學 怎樣進行大數據的入門級學習?
數據科學并沒有一個獨立的學科體系,統計學,機器學習,數據挖掘,數據庫,分布式計算,云計算,信息可視化等技術或方法來對付數據。
但從狹義上來看,我認為數據科學就是解決三個問題:
1. data pre-processing;(數據預處理)
2. data interpretation;(數據解讀)
3.data modeling and analysis.(數據建模與分析)
這也就是我們做數據工作的三個大步驟:
1、原始數據要經過一連串收集、提取、清洗、整理等等的預處理過程,才能形成高質量的數據;
2、我們想看看數據“長什么樣”,有什么特點和規律;
3、按照自己的需要,比如要對數據貼標簽分類,或者預測,或者想要從大量復雜的數據中提取有價值的且不易發現的信息,都要對數據建模,得到output。
這三個步驟未必嚴謹,每個大步驟下面可能依問題的不同也會有不同的小步驟,但按我這幾年的經驗來看,按照這個大思路走,數據一般不會做跑偏。
這樣看來,數據科學其實就是門復合型的技術,既然是技術就從編程語言談起吧,為了簡練,只說說R和Python。但既然是薦數據科學方面的書,我這里就不提R/Python編程基礎之類的書了,直接上跟數據科學相關的。
R programming
如果只是想初步了解一下R語言已經R在數據分析方面的應用,那不妨就看看這兩本:
R in action:我的R語言大數據101。其實對于一個沒有任何編程基礎的人來說,一開始就學這本書,學習曲線可能會比較陡峭。但如果配合上一些輔助材料,如官方發布的R basics(),stackoverflow上有tag-R的問題集(Newest ‘r’ Questions),遇到復雜的問題可在上面搜索,總會找到解決方案的。這樣一來,用這本書拿來入門學習也問題不大。而且這本書作者寫得也比較輕松,緊貼實戰。
Data analysis and graphics using R:使用R語言做數據分析的入門書。這本書的特點也是緊貼實戰,沒有過多地講解統計學理論,所以喜歡通過情境應用來學習的人應該會喜歡這本入門書。而且這本書可讀性比較強,也就是說哪怕你手頭沒電腦寫不了代碼,有事沒事拿出這本書翻一翻,也能讀得進去。
但如果你先用R來從事實實在在的數據工作,那么上面兩本恐怕不夠,還需要這些:
Modern applied statistics with S:這本書里統計學的理論就講得比較多了,好處就是你可以用一本書既復習了統計學,又學了R語言。(S/Splus和R的關系就類似于Unix和Linux,所以用S教程學習R,一點問題都沒有)
Data manipulation with R:這本書實務性很強,它教給你怎么從不同格式的原始數據文件里讀取、清洗、轉換、整合成高質量的數據。當然和任何一本注重實戰的書一樣,本書也有豐富的真實數據或模擬數據供你練習。對于真正從事數據處理工作的人來說,這本書的內容非常重要,因為對于任何研究,一項熟練的數據預處理技能可以幫你節省大量的時間和精力。否則,你的研究總是要等待你的數據。
R Graphics Cookbook:想用R做可視化,就用這本書吧。150多個recipes,足以幫你應付絕大多數類型的數據。以我現在極業余的可視化操作水平來看,R是最容易做出最漂亮的圖表的工具了。
An introduction to statistical learning with application in R:這本書算是著名的the element of statistical learning的姊妹篇,后者更注重統計(機器)學習的模型和算法,而前者所涉及的模型和算法原沒有后者全面或深入,但卻是用R來學習和應用機器學習的很好的入口。
A handbook of statistical analysis using R:這本書內容同樣非常扎實,很多統計學的學生就是用這本書來學習用R來進行統計建模的。
Python
Think Python,Think Stats,Think Bayes:這是Allen B. Downey寫的著名的Think X series三大卷。其實是三本精致的小冊子,如果想快速地掌握Python在統計方面的操作,好好閱讀這三本書,認真做習題,答案鏈接在書里有。這三本書學通了,就可以上手用Python進行基本的統計建模了。
Python For Data Analysis: 作者是pandas的主要開發者,也正是Pandas使Python能夠像R一樣擁有dataframe的功能,能夠處理結構比較復雜的數據。這本書其實analysis講得不多,說成數據處理應該更合適。掌握了這本書,處理各種糟心的數據就問題不大了。
Introduction to Python for Econometrics, Statistics and Data Analysis:這本書第一章就告訴你要安裝Numpy, Scipy, Matplotlib, Pandas, IPython等等。然后接下來的十好幾章就是逐一介紹這幾個庫該怎么用。很全面,但讀起來比較枯燥,可以用來當工具書。
Practical Data Analysis: 這本書挺奇葩,貌似很暢銷,但作者把內容安排得東一榔頭西一棒子,什么都講一點,但一個都沒講透。這本書可以作為我們學習數據分析的一個索引,看到哪塊內容有意思,就順著它這個藤去摸更多的瓜。
Python Data Visualization Cookbook: 用Python做可視化的教材肯定不少,我看過的也就這一本,覺得還不錯。其實這類書差別都不會很大,咬住一本啃下來就是王道
Exploratory Data Analysis 和 Data Visualization
Exploratory Data Analysis:John Tukey寫于1977年的經典老教材,是這一領域的開山之作。如今EDA已經是統計學里的重要一支,但當時還是有很多人對他的工作不屑一顧。可他愛數據,堅信數據可以以一種出人意料的方式呈現出來。正是他的努力,讓數據可視化成為一門無比迷人的技術。但這本書不推薦閱讀了,內容略過時。要想完整地了解EDA,推薦下一本:
Exploratory Data Analysis with MATLAB:這本書雖然標題帶了個MATLAB,但實際上內容幾乎沒怎么講MATLAB,只是每講一個方法的時候就列出對應的MATALB函數。這本書的重要之處在于,這是我讀過的講EDA最系統的一本書,除了對visualization有不輸于John Tucky的講解外,對于高維的數據集,通過怎樣的方法才能讓我們從中找到潛在的pattern,這本書也做了詳盡的講解。全書所以案例都有對應的MATALB代碼,而且還提供了GUI(圖形用戶界面)。所以這本書學起來還是相當輕松愉悅的。
Visualize This:中譯本叫“鮮活的數據”,作者是個“超級數據迷”,建立了一個叫的網頁展示他的數據可視化作品,這本書告訴你該選擇什么樣的可視化工具,然后告訴你怎樣visualize關系型數據、時間序列、空間數據等,最后你就可以用數據講故事了。如果你只想感受一下數據可視化是個什么,可以直接點開下面這個鏈接感受下吧!A tour through the visualization zoo(A Tour Through the Visualization Zoo)
Machine Learning Data Mining
這一塊就不多說了,不是因為它不重要,而是因為它太太太重要。所以這一部分就推兩本書,都是”世界名著“,都比較難讀,需要一點點地啃。這兩本書拿下,基本就算是登堂入室了。其實作為機器學習的延伸和深化,概率圖模型(PGM)和深度學習(deep learning)同樣值得研究,特別是后者現在簡直火得不得了。但PGM偏難,啃K.Daphne那本大作實在太燒腦,也沒必要,而且在數據領域的應用也不算很廣。deep learning目前工業界的步子邁得比學術界的大,各個domain的應用如火如荼,但要有公認的好教材問世則還需時日,所以PGM和deep learning這兩塊就不薦書了。
The Element of Statistical Learning:要學機器學習,如果讓我只推薦一本書,我就推薦這本巨著。Hastie、Tibshirani、Friedman這三位大牛寫書寫得太用心了,大廈建得夠高夠大,結構也非常嚴謹,而且很有前瞻性,納入了很多前沿的內容,而不僅僅是一部綜述性的教材。(圖表也做得非常漂亮,應該是用R語言的ggplot2做的。)這本書注重講解模型和算法本身,所以需要具備比較扎實的數理基礎,啃起這本書來才不會太吃力。事實上掌握模型和算法的原理非常重要。機器學習(統計學習)的庫現在已經非常豐富,即使你沒有完全搞懂某個模型或算法的原理和過程,只要會用那幾個庫,機器學習也能做得下去。但你會發現你把數據代進去,效果永遠都不好。但是,當你透徹地理解了模型和算法本身,你再調用那幾個庫的時候,心情是完全不一樣的,效果也不一樣。
Data Mining: Concepts and Techniques, by Jiawei Han and Micheline Kamber 數據挖掘的教材汗牛充棟,之所以推薦這本韓家煒爺爺的,是因為雖然他這本書的出發點是應用,但原理上的內容也一點沒有落下,內容非常完整。而且緊跟時代,更新的很快,我看過的是第二版,就已經加進去了social network analysis這種當時的前沿內容。現在已經有第三版了,我還沒看過,但應該也加入了不少新內容。其實這本書并不難讀,只是篇幅較長,啃起來比較耗時。
其實這兩本書里單拎出來一塊內容可能又是幾本書的節奏,比如bayesian方法,再拿出兩三本書來講也不為過,我個人用到的比較多,而且也確實有不少好書。但并非是所有data scientist都要用到,所以這一塊就不再細說。
還有一些印象比較深刻的書:
Big Data Glossary: 主要講解大數據處理技術及工具,內容涵蓋了NoSQL,MapReduce,Storage,Servers,NLP庫與工具包,機器學習工具包,數據可視化工具包,數據清洗,序列化指南等等。總之,是一本辭典式的大數據入門指導。
Mining of Massive Datasets:這本書是斯坦福大學Web Mining的講義,里面很多內容與韓家煒的Data Mining那本書重合,但這本書里詳細地講了MapReduce的設計原理,PageRank(Google創業時期的核心排序算法,現在也在不斷優化更新)講解得也比較詳細。
Developing Analytic Talent: 作者是個從事了十幾年數據工作的geek,技術博客寫得很有個人風格,寫的內容都比較偏門,通常只有具備相關數據處理經驗的人能體會出來,絲毫不照顧初學者的感受。比如他會談到當數據流更新太快時該怎么辦,或者MapReduce在什么時候不好用的問題,才不管你懂不懂相關基礎原理。所以這本書不太適合初學者閱讀。這本書其實是作者的博客文章的集結,用how to become a data scientist的邏輯把他近幾年的博客文章串聯了起來。
Past, Present and Future of Statistical Science:這本書是由COPSS(統計學社主席委員會,由國際各大統計學會的帶頭人組成)在50周年出版的一本紀念冊,里面有50位統計學家每人分別貢獻出的一兩篇文章,有的回憶了自己當年如何走上統計學這條路,有的探討了一些統計學的根本問題,有的談了談自己在從事的前沿研究,有的則給年輕一代寫下了寄語。非常有愛的一本書。
其它資料
Harvard Data Science:這是H大的Data science在線課,我沒有修過,但口碑很好。這門課需要費用8千刀左右,比起華盛頓大學的4千刀的Data science在線課雖貴一倍,但比斯坦福的14千刀要便宜將近一半(而且斯坦福的更偏計算機)。如果想自學,早有好心人分享了slides:(;usp=sharing)和homeworks and solutions:()
PyData:PyData是來自各個domain的用Python做數據的人每年舉行一次的聚會,期間會有各路牛人舉行一些規模不大的seminar或workshop,有好心人已經把video上傳到github,有興趣的去認領吧(DataTau/datascience-anthology-pydata · GitHub)
工具
R/Python/MATLAB(必備):如果是做數據分析和模型開發,以我的觀察來看,使用這三種工具的最多。R生來就是一個統計學家開發的軟件,所做的事也自然圍繞統計學展開。MATLAB雖然算不上是個專業的數據分析工具,但因為很多人不是專業做數據的,做數據還是為了自己的domain expertise(特別是科學計算、信號處理等),而MATLAB又是個強大無比的Domain expertise工具,所以很多人也就順帶讓MATLAB也承擔了數據處理的工作,雖然它有時候顯得效率不高。Python雖然不是做數據分析的專業軟件,但作為一個面向對象的高級動態語言,其開源的生態使Python擁有無比豐富的庫,Numpy, Scipy 實現了矩陣運算/科學計算,相當于實現了MATLAB的功能,Pandas又使Python能夠像R一樣處理dataframe,scikit-learn又實現了機器學習。
SQL(必備):雖然現在人們都說傳統的關系型數據庫如Oracle、MySQL越來越無法適應大數據的發展,但對于很多人來說,他們每天都有處理數據的需要,但可能一輩子都沒機會接觸TB級的數據。不管怎么說,不論是用關系型還是非關系型數據庫,SQL語言是必須要掌握的技能,用什么數據庫視具體情況而定。
MongoDB(可選):目前最受歡迎的非關系型數據庫NoSQL之一,不少人認為MongoDB完全可以取代mySQL。確實MongoDB方便易用,擴展性強,Web2.0時代的必需品。
Hadoop/Spark/Storm(可選): MapReduce是當前最著名也是運用最廣泛的分布式計算框架,由Google建立。Hadoop/Spark/storm都是基于MapReduce的框架建立起來的分布式計算系統,要說他們之間的區別就是,Hadoop用硬盤存儲數據,Spark用內存存儲數據,Storm只接受實時數據流而不存儲數據。一言以蔽之,如果數據是離線的,如果數據比較復雜且對處理速度要求一般,就Hadoop,如果要速度,就Spark,如果數據是在線的實時的流數據,就Storm。
OpenRefine(可選):Google開發的一個易于操作的數據清洗工具,可以實現一些基本的清洗功能。
Tableau(可選):一個可交互的數據可視化工具,操作簡單,開箱即用。而且圖表都設計得非常漂亮。專業版1999美刀,終身使用。媒體和公關方面用得比較多。
Gephi(可選):跟Tableau類似,都是那種可交互的可視化工具,不需要編程基礎,生成的圖表在美學和設計上也是花了心血的。更擅長復雜網絡的可視化。
windows平臺可以看看《Windows Server 2003服務器架設與管理》。
作為推薦,這里我主要還是推薦自己仔細研讀過的書,而我讀過的書中某些可能已經很老了,甚至內容已經過時了,因此,這只算是拋磚引玉,大家可以選擇類似的更新、更權威的書籍學習。
基礎知識主要包括:語言。這里之所以拿出來說,是因為某些語言可能導致你使用完全不同的思路來設計服務器。一般來說,C/C++、Java、C# 之類可以歸為一類,而 Go、Erlang 和他們區別很顯著。關于語言的經典書籍太多,這里就不說了。
網絡。想了解協議底層實現,可以看《TCP/IP 詳解 卷2》。上層開發時,Windows 下可以看《Network Programming for Microsoft Windows》,Linux 下可以直接看看官方相關的 API 文檔。Windows 下 IOCP,Linux 下 epoll(其他類 Unix 下的技術類似)是需要掌握的。實際開發中,網絡庫可能自己實現,也可以基于某些開源庫開發,所以,無論是出于學習還是使用目的,都可以研究一下開源庫,例如 libuv、libevent、boost ASIO。
操作系統相關。類 Unix 系統比較好的書籍就是《Advanced Programming in the UNIX Environment》了,Windows 下則可以看看《Windows核心編程》。系統相關的最核心的東西可能就是線程、進程,以及相關同步的內容了,看看《Multithreading applications in Win32》挺不錯(包括類 Unix 系統下的開發者)
數據庫。主要看你選擇 SQL 還是 NOSQL。基本上搞搞 mysql、redis 不會錯。
一些思想。光會各種技術是不能寫出好的代碼的,可能還需要學習一些更抽象的知識,所謂的一些”哲學“或者開發的指導思想。比較推薦的是《UNIX 編程藝術》,還有一本書《精益思想》,這本書和編程完全無直接關系。
《網絡游戲核心技術與實戰》日本人寫的網絡游戲服務器端開發的書, 結合游戲開發講到了服務器端的方方面面, 但是相對的可能不夠深入. 適合入門, 對游戲和技術有更好的理解. 然后就可以針對特定的技術領域, 比如網絡, 數據存儲等找專門的書來看了. 單純從技術角度而言, 基礎的東西并沒有太多的不同. 只是網絡游戲服務器端的應用領域相對狹窄, 所以市面上專門的書籍并不多。
當年互聯網瘋狂發展的時候,很多人在觀望和猶豫中錯過了這班順風車(沒有盡早開個淘寶店,腸子都悔青了好幾遍呢)。如今,同樣的橋段上演,大數據時代,堅決不能再無動于衷!
于是,你著急,你迷茫,你很方……除了平時要加班加點的搬磚,牙縫里擠出來的的閑碎時間都貢獻給度娘了,“小白如何學習大數據”,“大數據入門書籍有哪些”……
1:
這是學習大數據必讀的一本書,也是最系統的關于大數據概念的一本書,由維克托·邁爾-舍恩伯格和肯尼斯·庫克耶編寫,主要介紹了大數據理念和生活工作及思維變革的關系。
它被包括寬帶資本董事長田朔寧、知名IT評論人謝文等專業讀者鑒定為“大數據領域最好的著作沒有之一,一本頂一萬本”。有這么好嗎?看完自己評價吧。這本書對這個大規模產生、分享和應用數據的新的大時代進行了闡述和厘清,作者圍繞“要全體不要抽樣、要效率不要絕對精確、要相關不要因果”三大理念,通過數十個商業和學術案例,剖析了萬事萬物數據化和數據復用挖掘的巨大價值。
2:
由巴拉巴西編寫,主要講了在一個歷史故事的連續講述中,了解大數據的概念實質。從大數據的歷史開始,能更深入的了解大數據的發展歷程。
巴拉巴西整本書講述的大數據根本目的,是預測。他甚至有零有整地判斷,人類行為93%是可以預測的。打個比方,千百年前人類無法如今天般準確預測天氣,以致某些大致預測的行為都被認為是“通神”,其實核心在于對天氣數據的海量占有和分析能力。但假如全人類的所有基礎及行為數據全部被占有全部能分析呢?比如通過智能終端LBS功能采集全部運動軌跡、通過金融系統采集所有支付記錄、通過SNS采集所有社會關系和通過郵件、文檔、社會視頻監控和自我視頻監測采集所有言行記錄,24小時,每分每秒,一生,全地球70億人,那會如何?
3:
由徐子沛編寫,看美國政府在大數據開放上的進程與反復,算是個案。如果能夠基本了解這三本的觀點,出門有底氣,見人腰桿直,不再被忽悠。
全書講述的,是大數據在美國政府管理中的應用,以及美國政府運行方式大數據變革的歷史與斗爭,其實也是故事性的。從奧巴馬上臺就頒布《信息公開法案》,到設立第一個美國政府首席信息官開始,講述美國政府與民間在社會數據公開的斗爭史,以及美國社會管理向大數據思維轉變的過程。首先,這算是一個最詳實的案例;其次,這代表的不是某種管理方式變革,深處是對民主運行機制的變革與進步。說好了,這本書用心良苦,遠遠超越科普技術領域;說壞了,其心可誅。有一段,民間斗爭,逼迫奧巴馬公布所有每日白宮全部日程,包括接見了誰、談話的全部內容,這不就是個人大數據全公開在公眾人物上的應用嗎?這可比現在所謂官員公開財產的要求高了幾十倍——這要求政府全部行為、全部數據、全部公開,全體公眾隨時可查——技術和成本上其實已經可以做到或至少努力接近——如果不這么做,不止是落后問題而是真正的其心可誅了。
4:
由陳明編寫。看名字就知道,入門級別拯救小白的書。這本書共17章,第1章是對大數據的簡單概述,第2章介紹大數據研究的方法論,第3、8、9、14章介紹大數據的生態環境,第17章介紹數據科學的內容,剩下的章節是本書重點,介紹大數據技術及應用方法。
身處大數據大環境下,身邊的人經常討論數據庫、數據可視化、大數據預處理等等。這些詞聽得多了會讓人產生錯覺——自己已經知道里面的門道了。但事實上還是個“門外漢”。
舉個例子,沒有人肯在上千人規模的講座上專門花半個小時教你怎樣進行數據清洗。本書專門列了一章,詳細介紹大數據預處理技術,包括數據清洗的實現方式,從步驟到檢驗,都做了用心的闡述。諸如此類,數據挖掘、大數據流式計算、Hadoop、NoSQL等等都從最基礎的點做了詳細介紹。耐心看完這些,再往深處進階就不會那么吃力了。
5:
進入大數據時代,讓數據開口說話將成為司空見慣的事情,本書將從大數據時代的前因后果講起,全面分析大數據時代的特征、企業實踐的案例、大數據的發展方向、未來的機遇和挑戰等內容,展現一個客觀立體、自由開放的大數據時代。
5:
入門,淺顯易懂,里面每一章都是一個案例,但是很方便,有具體的代碼,用來入門最好。
6:
專門做社交網絡的數據挖掘,案例很豐富,有代碼。
7:
致力于介紹各種可視化方案。
8:
比較簡單的可視化,不過內容豐富,有代碼。
9:
看完上述的書,對大數據產生很大的興趣,已經初步入門了,現在開始理論方面的學習,數據挖掘入門教程,個人覺得寫的很好,目前正在研究這本書,努力。。。
10:
這本書比較深,剛開始看的就是這一本,不過太深,看到一半,準備在導論看完之后,在看這本書提升一下自己。
11:
作為一個計算機專業Linux那是必學的,而且Hadoop是建立在Linux基礎上的,不求多么的精通,但是基礎的操作要學會。
如果是沒有任何編程語言基礎的想入行大數據的話,是必須要學習java基礎的,雖然大數據支持很多開發語言,但是企業用的最多的還是java,接下來學習數據結構,關系型數據庫,linux系統操作,有了基礎之后,在進入大數據學習,可以給小白學習的體系。
第一階段
COREJAVA(加**的需重點熟練掌握,其他掌握)
Java基礎**
數據類型
運算符、循環
算法
順序結構程序設計
程序結構
數組及多維數組
面向對象**
構造方法、控制符、封裝
繼承**
多態**
抽象類、接口**
常用類
集合Collection、list**
HashSet、TreeSet、Collection
集合類Map**
異常
File
文件/流**
數據流和對象流**
線程(理解即可)
網絡通信(理解即可)
第二階段
數據結構
關系型數據庫
Linux系統操作
Linux操作系統概述
安裝Linux操作系統
圖形界面操作基礎
Linux字符界面基礎
字符界面操作進階
用戶、組群和權限管理
文件系統管理
軟件包管理與系統備份
Linux網絡配置
(主要掌握Linux操作系統的理論基礎和服務器配置實踐知識,同時通過大量實驗,著重培養學生的動手能力。使學生了解Linux操作系統在行業中的重要地位和廣泛的使用范圍。在學習Linux的基礎上,加深對服務器操作系統的認識和實踐配置能力。加深對計算機網絡基礎知識的理解,并在實踐中加以應用。掌握Linux操作系統的安裝、命令行操作、用戶管理、磁盤管理、文件系統管理、軟件包管理、進程管理、系統監測和系統故障排除。掌握Linux操作系統的網絡配置、DNS、DHCP、HTTP、FTP、SMTP和POP3服務的配置與管理。為更深一步學習其它網絡操作系統和軟件系統開發奠定堅實的基礎。與此同時,如果大家有時間把javaweb及框架學習一番,會讓你的大數據學習更自由一些)
重點掌握:
常見算法
數據庫表設計
SQL語句
Linux常見命令
第三階段
Hadoop階段
離線分析階段
實時計算階段
重點掌握:
Hadoop基礎
HDFS
MapReduce
分布式集群
Hive
Hbase
Sqoop
Pig
Storm實時數據處理平臺
Spark平臺
若之前沒有項目經驗或JAVA基礎,掌握了第一階段進入企業,不足以立即上手做項目,企業需再花時間與成本培養;
第二階段掌握扎實以后,進入企業就可以跟著做項目了,跟著一大幫人做項目倒也不用太擔心自己能不能應付的來,當然薪資不能有太高的要求;
前兩個階段都服務于第三階段的學習,除了熟練掌握這些知識以外,重點需要找些相應的項目去做,不管項目大小做過與沒有相差很多的哦!掌握扎實后可直接面對企業就業,薪資待遇較高!
做前端開發9年,推薦你下看下面的6本書
《JavaScript DOM 編程藝術》
超級前端暢銷書,作為前端程序員必讀兩遍以上的書籍,這本書籍特別適合初學前端的新人,前端的核心技術就是JavaScript,同時也是前端的難點。而這本書非常適合入門,通俗易懂,生動的案例可以讓初學者更好的進行理解。所提及的很多編程思想卻適合低中級層次的前端開發者學習。
《JavaScript權威指南》
同樣是前端程序員必讀的一本書籍,不僅適合初學者,還適合那些已經在做前端工作的程序員進行隨時翻閱。里面涵蓋了JavaScript的所有內容,以及web瀏覽器所實現的JavaScript
API。對于了解js的基礎知識,比如對象,數組,語法,作用域,閉包等等都很有幫助。
《JavaScript 高級程序設計》
如果你想把JavaScript非常完全的系統學習一遍,我強烈推薦這本書,這本書可以一直保留,在用這本書的過程中還可以畫下重點,以后可以作為參考,是工作中非常強力的幫手。面試的時候也可以很好的應用上,我們俗稱的“紅寶書”。
《你不知道的JavaScript》
這本書不適合前端的初學者,想要深入的了解JavaScript原理,這是每一個前端程序員必須要研究的一本書籍。要讓不求甚解的JavaScript開發者迎難而上,深入語言內部,弄清楚JavaScript每一個零部件的用途。如果可以把這本書吃透,那么以后理解任何東西都可以很快的理解和掌握。
《Vue.js權威指南》
Vue作為現在前端的主流框架,在國內應用最為廣泛,所以了解Vue原理必須要啃一本Vue的書籍。我之所以推薦這本,是因為這本書對于引導初用Vue的開發者有著質的提升。從基礎知識到主流打包以及源碼解析,還有很多實踐的案例,都是一本不錯的實用性書籍。主要內容包括數據綁定、指令、表單控件綁定、過濾器、組件、表單驗證、服務通信、路由和視圖、vue-cli、測試開發和調試、源碼解析及主流打包構建工具等。該書內容全面,講解細致,示例豐富,適用于各層次的開發者。
《編程之美》
無論是什么崗位的程序員,必讀的一本書籍,沒有讀過這本書的程序員幾乎都是假程序員。這本書有60道算法和程序設計題目,這些題目大部分在近年的筆試,面試中出現過,或者是被微軟員工熱烈討論過。作者試圖從書中各種有趣的問題出發,引導讀者發現問題,分析問題,解決問題,尋找更優的解法。可以大幅度提高自己的編程思維和對于這個行業的深入思考,最終變成技術大牛。
如果不想買紙質版的書籍,到我的前端交流分享群進行下載PDF電子書。
常在這里回答問題,熱愛技術,喜歡幫別人解答行業技術問題和行業知識。
如果大家對于學習前端有任何不懂的可以隨時來問我,我給你提供一個非常不錯的前端交流學習qun:前面是二九六,中間是二一二,后面是五六二。有問題就在里面問我,這樣你可以少走很多彎路,做起來有效率,記得多跟有經驗的人交流,別閉門造車。如果沒有比較好的教程,也可以管我要。
你對此有什么見解,覺得小編推薦的這些前端書籍還靠譜嗎?
評論區說出你的想法!
文章名稱:nosql入門書,nosql的三大基石
文章起源:http://www.yijiale78.com/article46/hcseeg.html
成都網站建設公司_創新互聯,為您提供ChatGPT、外貿建站、網站設計公司、移動網站建設、企業建站、全網營銷推廣
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯