کتابخانه‌ای ویژه متخصصان علم داده
بهترین کتابخانه‌های پایتون ویژه داده‌کاوی
پایتون در کنار سایر زبان‌های برنامه‌نویسی سطح بالا با تاکید ویژه روی دو رویکرد همه منظوره و شی‌گرا بودن، از سوی میلیون توسعه‌دهنده در سراسر جهان استفاده می‌شود. زبانی که ترکیب نحوی آن ساده بوده، از معماری‌ها و الگوهای طراحی مختلفی همچون تابعی، دستوری و شی‌گرایی پشتیبانی کرده و مهم‌تر از آن ابزار اصلی برنامه‌نویسان هوش مصنوعی و علم داده‌ها است. اما قدرت پایتون زمانی دو چندان می‌شود که از کتابخانه‌ها و چارچوب‌های قدرتمندی که برای پارادایم‌های مختلف این زبان ارائه شده است استفاده کنید. در این مقاله با 10 مورد از برجسته‌ترین کتابخانه‌های پایتون در حوزه علم داده‌ها آشنا خواهید شد.

1606683296_1_0.gif

گزارش منتشر شده از سوی builtwith.com نشان می‌دهد که 45 درصد از شرکت‌های فناوری ترجیح می‌دهند از پایتون در دو حوزه برنامه‌نویسی تحت وب و هوش مصنوعی استفاده کنند. ترکیب نحوی و ساده بودن کار با کتابخانه عامل اصلی محبوبیت پایتون در این دو حوزه عنوان شده است. با توجه به این‌که در چند وقت اخیر شاهد بوده‌ایم که گرایش توسعه‌دهندگان ایرانی به سمت برنامه‌نویسی هوش مصنوعی و علم داده‌ها متمایل شده است، در این مقاله تصمیم گرفتیم 10 مورد از پر استفاده‌ترین کتابخانه‌های پایتون ویژه علم داده‌ها را در مجله شبکه معرفی کنیم.

نکته‌ای که لازم است به آن اشاره داشته باشیم در ارتباط با فهرستی است که در ادامه مشاهده خواهید کرد. کتابخانه‌های معرفی شده در این فهرست به دلیل هم‌پوشانی با شاخه‌های دیگر هوش مصنوعی ممکن است در گروه‌های دیگری نیز وارد شوند، اما کاربرد اصلی آن‌ها در ارتباط با علم داده‌کاوی است. این فهرست بر مبنای میزان مشارکت توسعه‌دهندگان و تعداد ستاره‌هایی که هر یک از این کتابخانه‌ها در سایت گیت‌هاب به دست آورده‌اند مرتب شده‌اند. شکل زیر به خوبی این مسئله را نشان می‌دهد.

1.pandas

Pandas یک کتابخانه پایتون است که ساختارهای داده‌ها منعطف، سریع و به دور از پیچیدگی‌های رایج را برای کار با داده‌ها یا برچسب‌های رابطه‌ای در اختیار پژوهشگران علم داده قرار می‌دهد تا بینش لازم برای کار با داده‌ها را به دست آورند. این کتابخانه با هدف ایجاد بلوک‌های سازنده سطح بالا برای پیاده‌سازی تحلیل‌های واقعی و به‌کارگیری این تحلیل‌ها در پایتون طراحی طراحی شده است. در حال حاضر نزدیک به 1328 مشارکت‌کننده فعال روی گیت‌هاب این کتابخانه را مدیریت کرده است. کتابخانه‌‌ای که موفق شده است 16890 هزار ستاره در گیت‌هاب به دست آورد.

لینک دسترسی:  pandas

2. Matplotlib

(مت‌پلات) Matplotlib یک کتابخانه دو بعدی پایتون است که برای رسم نمودار در زبان پایتون استفاده می‌شود. رابط برنامه‌نویسی این کتابخانه بر مبنای پارادایم شی‌گرایی کار کرده که همین مسئله امکان‌ به‌کارگیری این کتابخانه در نرم‌افزارهای مجهز به رابط گرافیکی همچون wxPaython را ساده کرده است. از این کتابخانه می‌توان برای نوشتن اسکریپت‌های ساده (شبیه به اسکریپت‌های CGI) و به عنوان جایگزین مناسبی برای زبان مطلب استفاده کرد. کتابخانه‌ای که از فرمت SVG پشتیبانی می‌کند. از این کتابخانه همچنین می‌توان در شل IPython، برنامه‌های وب‌سرور و سایر رابط‌های کاربری گرافیکی استفاده کرد. در حال حاضر 771 مشارکت‌کننده روی گیت‌هاب این کتابخانه را مدیریت کرده و توانسته است 8224 ستاره روی گیت‌هاب دریافت کند.

لینک دسترسی: Matplotlib

3.NumPy

NumPy یک کتابخانه پایه‌ای است که در بیشتر محاسبات علمی در پایتون استفاده می‌شود. این کتابخانه می‌تواند اشیایی شبیه به آرایه‌های N بعدی، توابع پیچیده، ابزارهایی به منظور یکپارچه‌سازی کدهای سی پلاس پلاس، سی و فرترن را ارائه کرده و در نهایت در زمینه محاسبات جبر خطی، تبدیل سری‌های فوریه و اعداد تصادفی استفاده شود. در حال حاضر 708 مشارکت کننده از این کتابخانه پشیتبانی کرده و 8666 ستاره از گیت‌هاب دریافت کرده است.

لینک دسترسی:  NumPy

4. SciPy

Scipy یک کتابخانه متن‌باز بوده که در زمینه ریاضیات، مباحث علمی و مهندسی استفاده می‌شود. این کتابخانه شامل ماژول‌هایی است که  در حوزه آمار، بهینه‌سازی، یکپارچه‌سازی، جبر خطی تبدیل سری‌های فوریه، پردازی سیگنال و پردازش تصاویر، معادلات دیفرانسیل و... قابل استفاده است. در حال حاضر 670 مشارکت کننده روی گیت‌هاب داشته و 5096 ستاره روی گیت‌هاب به دست آورده است.

لینک دسترسی: SciPy

5. Bokeh

Bokeh یک کتابخانه تعاملی تجسم‌سازی برای پایتون است که به توسعه‌دهندگان اجازه می‌دهد یک نمای بصری زیبا و قابل فهم از داده‌ها را پیاده‌سازی کنند. نمایی که روی مرورگرهای وب مدرن قابل مشاهده است. این کتابخانه به شما اجازه می‌دهد در کوتاه‌ترین زمان و با کمترین زحمت ممکن نمودارهای تعاملی، داشبوردها و برنامه‌های کاربردی مبتنی بر داده‌ها را ایجاد کنید. در حال حاض 325 مشارکت کننده از آن پشتیبانی کرده و 8439 ستاره روی گیت‌هاب به دست آورده است.

لینک دسترسی: Bokeh

6.Gensim

Gensim یک کتابخانه پایتون بوده که برای مدل‌سازی موضوعات، شاخص‌گذاری مستندات و بازیابی تشابهات در اسناد بزرگ قابل استفاده است. این کتابخانه برای افرادی که در حوزه پردازش زبان طبیعی به فعالیت اشتغال دارند و همچنین افرادی که در زمینه بازیابی اطلاعات فعال هستند مفید است. در حال حاضر 29 مشارکت کننده روی این پروژه مشارکت داشته و 8107 ستاره از گیت‌هاب به دست آورده است.

لینک دسترسی: Gensim

7. Scrapy

Scrapy چارچوب ویژه‌ای بوده که در دو زمینه Web Scraping و Web Crawling قابل استفاده است. به عبارت دقیق‌تر در زمینه خزیدن در وب قابل استفاده است. این کتابخانه به توسعه‌دهندگان اجازه می‌دهد برنامه‌های کاربردی را با هدف خزش در سایت‌ها و استخراج داده‌ها طراحی کنند. رویکردی که شبیه به عملکرد روبات‌های اینترنتی است. البته کاربرد کتابخانه فوق فراتر از این بوده و در زمینه داده‌کاوی، نظارت بر دریافت داده‌ها، آزمایش خودکار و... قابل استفاده است. در حال حاضر 295 مشارکت کننده از این پروژه پشتیبانی کرده و 30014 ستاره روی گیت‌ها به دست آورده است.

لینک دسترسی: Scrapy

8. StatsModels

StatsModels کتابخانه پایتونی دیگری است که در حقیقت مکملی برای scipy بوده و در زمینه محاسبات آماری شبیه به آمار توصیفی و برآوردی برای مدل‌های آماری قابل استفاده است. در حال حاضر 164 مشارکت کننده روی این پروژه فعال بوده و 3383 ستاره روی گیت‌هاب به دست آورده است.

لینک دسترسی: StatsModels

9.plotly.ly

Plotly.ly یک کتابخانه گرافیکی تعاملی و متن باز برای پایتون بوده که بر پایه مرورگرهای وب کار می‌کند. این کتابخانه بر مبنای plotly.js که کتابخانه‌ای سطح بالا برای رسم نمودا‌رها است طراحی شده است. plotly.js دست‌کم همراه با بیش از 30 نمونه نمودار در حوزه‌های علمی، گراف‌های سه بعدی، نمودارهای آماری، نقشه‌های مبتنی بر گرافیک SVG، نمودارهای آماری و سایر نمودارهای مشابه در اختیار توسعه‌دهندگان قرار دارد. در حال حاضر 62 مشارکت کننده روی این پروژه در گیت‌هاب فعال بوده و 4218 ستاره به دست آورده است.

لینک دسترسی: plotly.ly

10. pydot

Pydot  یک رابط کاربردی برای Graphviz و زبان Graph Description است. این کتابخانه شامل ضمن ارائه رابطی برای Graphviz، کلاس‌هایی برای رسم نمودارها و تبدیل نمودارها به زبان DOT ارائه کرده و شامل یک تجزیه کننده قابل استفاده در پایتون است.

لینک دسترسی:  pydo

ماهنامه شبکه را از کجا تهیه کنیم؟
ماهنامه شبکه را می‌توانید از کتابخانه‌های عمومی سراسر کشور و نیز از دکه‌های روزنامه‌فروشی تهیه نمائید.

ثبت اشتراک نسخه کاغذی ماهنامه شبکه     
ثبت اشتراک نسخه آنلاین

 

کتاب الکترونیک +Network راهنمای شبکه‌ها

  • برای دانلود تنها کتاب کامل ترجمه فارسی +Network  اینجا  کلیک کنید.

کتاب الکترونیک دوره مقدماتی آموزش پایتون

  • اگر قصد یادگیری برنامه‌نویسی را دارید ولی هیچ پیش‌زمینه‌ای ندارید اینجا کلیک کنید.

ایسوس

نظر شما چیست؟