
技術層面,爬蟲核心是前端技術,黑客是為信息安全;數(shù)據(jù)層面,一個是公開,一個是私有。爬蟲是黑客的一個小小技能。
數(shù)據(jù)公私之分
爬蟲是獲取公開的數(shù)據(jù),黑客是獲取私有的數(shù)據(jù)。一個是將用戶瀏覽的數(shù)據(jù)用程序自動化的方式收集起來,一個是尋找漏洞獲取私密數(shù)據(jù),又可分為白帽黑客和黑帽黑客。
比如用戶評論的數(shù)據(jù),商品價格的信息,比如用戶的視頻,這些通過瀏覽器大眾可以公開訪問到的數(shù)據(jù),可以通過爬蟲技術獲取,爬和反爬永遠存在著斗爭,因為爬蟲是機器,非真正的用戶。
而黑客如果獲取用戶銀行賬號,密碼,公司私有數(shù)據(jù)等等,即使用到爬蟲技術,但本質(zhì)上是黑客,如果用于非法目的去獲利,則是黑帽黑客。
技術領域不同
爬蟲主要涉及前端和數(shù)據(jù)存儲之分,比如通過模擬瀏覽器來將數(shù)據(jù)存儲起來,對于一些反爬技術做的好的站點,你要模擬登錄,cookie信息維護,有時還要翻看js代碼,核心技術是前端。
而黑客核心技術是是信息安全,涉及領域眾多,比如操作系統(tǒng)、網(wǎng)絡技術、編程技術、硬件技術等,技術上黑客目的是尋找漏洞,一切達到目的技術都要為我所用。
道德之眼
如果要寫爬蟲,頻率要放緩,否則會對服務器造成壓力,影響真實用戶體驗。有些數(shù)據(jù)涉及版權,爬取和使用上要留心。
如果做黑客,做白帽黑客,不要為了短期內(nèi)的私人利益把自己送進鐵房子,不值得。

簡單的說,黑客是個職業(yè),python爬出只算黑容獲得數(shù)據(jù)的一個工具!

因為python爬取數(shù)據(jù)的時候造成大量的數(shù)據(jù)訪問,且有可能暴露敏感信息且訪問網(wǎng)站的行為也不像正常用戶訪問,所以會被當成攻擊

Python爬蟲與黑客有本質(zhì)區(qū)別,爬蟲遵守robots 原則,抓取網(wǎng)站允許的,開放的內(nèi)容,黑客侵入系統(tǒng),盜取信息。

Python是工具,黑客現(xiàn)在還是指人,將來會不會擴展到智能機器人,或者一段智能代碼,還不知道?,F(xiàn)在所有的概念都是在不斷變化的,學習中。

python是一種技術,黑客指的是一群人。
python爬蟲是一種自動獲取大量信息的技術,技術本身并沒有好壞之分。舉個例子:我曾經(jīng)在超市里見過有人拿個本子不停在記商品價格,后來通過了解得知是其他超市在統(tǒng)計別的超市價格,以便自己針對其進行調(diào)整。這種行為雖然不討喜,但本分并沒有違反法律,因為超市的價格是向所有人公開的,不以違法行為為目的獲取公開的信息是不違法的。但如果這種行為超過了一個度,比如雇傭大量抄價格的人嚴重影響了超市的正常營業(yè),或者通過其他途徑去“抄”進價等其他保密信息,這就跟爬蟲頻率過高,形成ddos攻擊和利用漏洞爬取他人保密信息一樣是違法的。
“Hacker”(黑客)一般是指: 一個對(某領域內(nèi)的)編程語言有足夠了解,可以不需長久思考便創(chuàng)造出有用軟件的人。 喜愛編程并享受在其中,而變得愈加擅長于編程的人。 他們喜愛自由、不易受約束,但假如是為了喜愛的事物,則可以接受被適當?shù)丶s束。
來自維基百科
從黑客的定義看他們只是一群電腦技術高超的人。跟普通人分好壞一樣,黑客也分白帽、灰帽、黑帽三種,白帽致力于保護網(wǎng)絡安全一般是正規(guī)網(wǎng)絡安公司員工,灰帽通過破解入侵炫耀自己的技術,黑帽以破壞他人或者獲得不法利益為目的攻擊他人。
所以用python爬蟲的不一定是黑客,黑客可能會用python爬蟲,符合法律的利用爬蟲技術就是正常行為,以損害竊取為目的使用爬蟲就是違法的黑客行為。關鍵在人而不在技術。
