久99久女女精品免费观看69堂-久99久热只有精品国产女同-久re在线精品观看9-久艾草久久综合精品无码-久艾草久久综合精品无码国产-久爱www

當前位置:首頁 > 結(jié)構(gòu)工程師 > 正文

Python結(jié)構(gòu)工程師,python 結(jié)構(gòu)圖

  ??

  作者 | ActiveWizards

  譯者 | 婉清

  編輯 | 阿司匹林

  出品 | AI科技大本營(公眾號ID:rgznai100)

  Python 在解決數(shù)據(jù)科學任務和挑戰(zhàn)方面繼續(xù)處于領(lǐng)先地位。去年,我們曾發(fā)表一篇博客文章 Top 15 Python Libraries for Data Science in 2017,概述了當時業(yè)已證明最有幫助的Python庫。今年,我們擴展了這個清單,增加了新的 Python 庫,并重新審視了去年已經(jīng)討論過的 Python 庫,重點關(guān)注了這一年來的更新。

  我們的選擇實際上包含了 20 多個庫,因為其中一些庫是相互替代的,可以解決相同的問題。因此,我們將它們放在同一個分組。

▌核心庫和統(tǒng)計數(shù)據(jù)

  1. NumPy (Commits: 17911, Contributors: 641)

  官網(wǎng):https://www.numpy.org/

  NumPy 是科學應用程序庫的主要軟件包之一,用于處理大型多維數(shù)組和矩陣,它大量的高級數(shù)學函數(shù)集合和實現(xiàn)方法使得這些對象執(zhí)行操作成為可能。

  2. SciPy (Commits: 19150, Contributors: 608)

  官網(wǎng):https://scipy.org/scipylib/

  科學計算的另一個核心庫是 SciPy。它基于 NumPy,其功能也因此得到了擴展。SciPy 主數(shù)據(jù)結(jié)構(gòu)又是一個多維數(shù)組,由 Numpy 實現(xiàn)。這個軟件包包含了幫助解決線性代數(shù)、概率論、積分計算和許多其他任務的工具。此外,SciPy 還封裝了許多新的 BLAS 和 LAPACK 函數(shù)。

  3. Pandas (Commits: 17144, Contributors: 1165)

  官網(wǎng):https://pandas.pydata.org/

  Pandas 是一個 Python 庫,提供高級的數(shù)據(jù)結(jié)構(gòu)和各種各樣的分析工具。這個軟件包的主要特點是能夠?qū)⑾喈攺碗s的數(shù)據(jù)操作轉(zhuǎn)換為一兩個命令。Pandas包含許多用于分組、過濾和組合數(shù)據(jù)的內(nèi)置方法,以及時間序列功能。

Python結(jié)構(gòu)工程師,python 結(jié)構(gòu)圖  第1張

  4. StatsModels (Commits: 10067, Contributors: 153)

  官網(wǎng):https://www.statsmodels.org/devel/

  Statsmodels 是一個 Python 模塊,它為統(tǒng)計數(shù)據(jù)分析提供了許多機會,例如統(tǒng)計模型估計、執(zhí)行統(tǒng)計測試等。在它的幫助下,你可以實現(xiàn)許多機器學習方法并探索不同的繪圖可能性。

  Python 庫不斷發(fā)展,不斷豐富新的機遇。因此,今年出現(xiàn)了時間序列的改進和新的計數(shù)模型,即 GeneralizedPoisson、零膨脹模型(zero inflated models)和 NegativeBinomialP,以及新的多元方法:因子分析、多元方差分析以及方差分析中的重復測量。

  ▌可視化

  5. Matplotlib (Commits: 25747, Contributors: 725)

  官網(wǎng):https://matplotlib.org/index.html

  Matplotlib 是一個用于創(chuàng)建二維圖和圖形的底層庫。藉由它的幫助,你可以構(gòu)建各種不同的圖標,從直方圖和散點圖到費笛卡爾坐標圖。此外,有許多流行的繪圖庫被設(shè)計為與matplotlib結(jié)合使用。

  ??

  6. Seaborn (Commits: 2044, Contributors: 83)

  官網(wǎng):https://seaborn.pydata.org/

  Seaborn 本質(zhì)上是一個基于 matplotlib 庫的高級 API。它包含更適合處理圖表的默認設(shè)置。此外,還有豐富的可視化庫,包括一些復雜類型,如時間序列、聯(lián)合分布圖(jointplots)和小提琴圖(violin diagrams)。

  ??

  7. Plotly (Commits: 2906, Contributors: 48)

  官網(wǎng):https://plot.ly/python/

  Plotly 是一個流行的庫,它可以讓你輕松構(gòu)建復雜的圖形。該軟件包適用于交互式 Web 應用程,可實現(xiàn)輪廓圖、三元圖和三維圖等視覺效果。

  8. Bokeh (Commits: 16983, Contributors: 294)

  官網(wǎng):https://bokeh.pydata.org/en/latest/

  Bokeh 庫使用 Java 小部件在瀏覽器中創(chuàng)建交互式和可縮放的可視化。該庫提供了多種圖表集合,樣式可能性(styling possibilities),鏈接圖、添加小部件和定義回調(diào)等形式的交互能力,以及許多更有用的特性。

  9. Pydot (Commits: 169, Contributors: 12)

  官網(wǎng):https://pypi.org/project/pydot/

  Pydot 是一個用于生成復雜的定向圖和無向圖的庫。它是用純 Python 編寫的Graphviz 接口。在它的幫助下,可以顯示圖形的結(jié)構(gòu),這在構(gòu)建神經(jīng)網(wǎng)絡(luò)和基于決策樹的算法時經(jīng)常用到。

  ??

  ▌機器學習

  10. Scikit-learn (Commits: 22753, Contributors: 1084)

  官網(wǎng):https://scikit-learn.org/stable/

  這個基于 NumPy 和 SciPy 的 Python 模塊是處理數(shù)據(jù)的最佳庫之一。它為許多標準的機器學習和數(shù)據(jù)挖掘任務提供算法,如聚類、回歸、分類、降維和模型選擇。

  利用 Data Science School 提高你的技能

  Data Science School:https://datascience-school.com/

  11. XGBoost / LightGBM / CatBoost (Commits: 3277 / 1083 / 1509, Contributors: 280 / 79 / 61)

  官網(wǎng):https://xgboost.readthedocs.io/en/latest/https://lightgbm.readthedocs.io/en/latest/Python-Intro.htmlhttps://github.com/catboost/catboost

  梯度增強算法是最流行的機器學習算法之一,它是建立一個不斷改進的基本模型,即決策樹。因此,為了快速、方便地實現(xiàn)這個方法而設(shè)計了專門庫。就是說,我們認為 XGBoost、LightGBM 和 CatBoost 值得特別關(guān)注。它們都是解決常見問題的競爭者,并且使用方式幾乎相同。這些庫提供了高度優(yōu)化的、可擴展的、快速的梯度增強實現(xiàn),這使得它們在數(shù)據(jù)科學家和 Kaggle 競爭對手中非常流行,因為在這些算法的幫助下贏得了許多比賽。

  12. Eli5 (Commits: 922, Contributors: 6)

  官網(wǎng):https://eli5.readthedocs.io/en/latest/

  通常情況下,機器學習模型預測的結(jié)果并不完全清楚,這正是 Eli5 幫助應對的挑戰(zhàn)。它是一個用于可視化和調(diào)試機器學習模型并逐步跟蹤算法工作的軟件包,為 scikit-learn、XGBoost、LightGBM、lightning 和 sklearn-crfsuite 庫提供支持,并為每個庫執(zhí)行不同的任務。

Python結(jié)構(gòu)工程師,python 結(jié)構(gòu)圖  第2張

  ▌深度學習

  13. TensorFlow (Commits: 33339, Contributors: 1469)

  官網(wǎng):https://www.tensorflow.org/

  TensorFlow 是一個流行的深度學習和機器學習框架,由 Google Brain 開發(fā)。它提供了使用具有多個數(shù)據(jù)集的人工神經(jīng)網(wǎng)絡(luò)的能力。在最流行的 TensorFlow應用中有目標識別、語音識別等。在常規(guī)的 TensorFlow 上也有不同的 leyer-helper,如 tflearn、tf-slim、skflow 等。

  14. PyTorch (Commits: 11306, Contributors: 635)

  官網(wǎng):https://pytorch.org/

  PyTorch 是一個大型框架,它允許使用 GPU 加速執(zhí)行張量計算,創(chuàng)建動態(tài)計算圖并自動計算梯度。在此之上,PyTorch 為解決與神經(jīng)網(wǎng)絡(luò)相關(guān)的應用程序提供了豐富的 API。該庫基于 Torch,是用 C 實現(xiàn)的開源深度學習庫。

  15. Keras (Commits: 4539, Contributors: 671)

  官網(wǎng):https://keras.io/

  Keras 是一個用于處理神經(jīng)網(wǎng)絡(luò)的高級庫,運行在 TensorFlow、Theano 之上,現(xiàn)在由于新版本的發(fā)布,還可以使用 CNTK 和 MxNet 作為后端。它簡化了許多特定的任務,并且大大減少了單調(diào)代碼的數(shù)量。然而,它可能不適合某些復雜的任務。

  ▌分布式深度學習

  16. Dist-keras / elephas / spark-deep-learning (Commits: 1125 / 170 / 67, Contributors: 5 / 13 / 11)

  官網(wǎng):https://joerihermans.com/work/distributed-keras/https://pypi.org/project/elephas/https://databricks.github.io/spark-deep-learning/site/index.html

  隨著越來越多的用例需要花費大量的精力和時間,深度學習問題變得越來越重要。然而,使用像 Apache Spark 這樣的分布式計算系統(tǒng),處理如此多的數(shù)據(jù)要容易得多,這再次擴展了深入學習的可能性。因此,dist-keras、elephas 和 spark-deep-learning 都在迅速流行和發(fā)展,而且很難挑出一個庫,因為它們都是為解決共同的任務而設(shè)計的。這些包允許你在 Apache Spark 的幫助下直接訓練基于 Keras 庫的神經(jīng)網(wǎng)絡(luò)。Spark-deep-learning 還提供了使用 Python 神經(jīng)網(wǎng)絡(luò)創(chuàng)建管道的工具。

  ▌自然語言處理

  17. NLTK (Commits: 13041, Contributors: 236)

  官網(wǎng):https://www.nltk.org/

  NLTK 是一組庫,一個用于自然語言處理的完整平臺。在 NLTK 的幫助下,你可以以各種方式處理和分析文本,對文本進行標記和標記,提取信息等。NLTK 也用于原型設(shè)計和建立研究系統(tǒng)。

  18. SpaCy (Commits: 8623, Contributors: 215)

  官網(wǎng):https://spacy.io/

  SpaCy 是一個具有優(yōu)秀示例、API 文檔和演示應用程序的自然語言處理庫。這個庫是用 Cython 語言編寫的,Cython 是 Python 的 C 擴展。它支持近 30 種語言,提供了簡單的深度學習集成,保證了健壯性和高準確率。SpaCy 的另一個重要特性是專為整個文檔處理設(shè)計的體系結(jié)構(gòu),無須將文檔分解成短語。

  19. Gensim (Commits: 3603, Contributors: 273)

  官網(wǎng):https://radimrehurek.com/gensim/

  Gensim 是一個用于健壯語義分析、主題建模和向量空間建模的 Python 庫,構(gòu)建在Numpy和Scipy之上。它提供了流行的NLP算法的實現(xiàn),如 word2vec。盡管 gensim 有自己的 models.wrappers.fasttext實現(xiàn),但 fasttext 庫也可以用來高效學習詞語表示。

  ▌數(shù)據(jù)采集

  20. Scrapy (Commits: 6625, Contributors: 281)

  官網(wǎng):https://scrapy.org/

  Scrapy 是一個用來創(chuàng)建網(wǎng)絡(luò)爬蟲,掃描網(wǎng)頁和收集結(jié)構(gòu)化數(shù)據(jù)的庫。此外,Scrapy 可以從 API 中提取數(shù)據(jù)。由于該庫的可擴展性和可移植性,使得它用起來非常方便。

  ▌結(jié)論

  本文上述所列就是我們在 2018 年為數(shù)據(jù)科學領(lǐng)域中豐富的 Python 庫集合。與上一年相比,一些新的現(xiàn)代庫越來越受歡迎,而那些已經(jīng)成為經(jīng)典的數(shù)據(jù)科學任務的庫也在不斷改進。

  下表顯示了 GitHub 活動的詳細統(tǒng)計數(shù)據(jù):

  原文鏈接:https://activewizards.com/blog/top-20-python-libraries-for-data-science-in-2018/

發(fā)表評論

主站蜘蛛池模板: 国产成人免费高清激情视频 | 99热这里只有精品66 | 国产精品视频全国免费观看 | 精品国产乱码一区二区三区麻豆 | 一区二区三区免费精品视频 | 91在线精品国产电影 | 性生交片免费无码看人 | 国产午夜福利在线观看 | 午夜av免费播放不卡三区 | 人人爽久久久噜噜噜婷婷 | 亚洲乱码av中文一区二区 | 国产乱人伦av在线麻豆a | 免费高清7h片1区2区在线观看 | 亚洲av成人精品日韩一区 | 国产人妻人伦精品1国产丝袜 | 亚洲一区二区三区在线观看精品中文 | 国产精品免费视频一区二区 | 精品视频在线播放 | 亚洲自偷自拍另类第1页 | 国产午夜无码片在线观看 | 91久久国产成人免费观 | 亚洲另类无码专区国内精 | 四虎影视一区二区精品 | 日韩在线视频一区二区三区 | 国产精品精品一区二区人妖 | 国产伦精品一区二区三区视频痴汉 | 国产精品无码久久久久久免费 | 蜜桃久久精品成人无码av | 国产97精品爆乳奶水无码 | 国产日产高清欧美一区二区三区 | 二区在线观看 | 亚洲精品久 | 色欲aⅴ亚洲情无码av蜜桃 | 亚洲精品色| 国产美女精品三级在线观看 | 亚洲男男gv手机在线观看 | 91桃色下载免费下载官网版 | 91成人国产九色在线观看 | 精品一区二区三区91 | 秋霞韩国理伦电影在线观看hd | 99久久精品费精品国产一区二 |