ابزارهایی مانند NumPy، Pandas، Matplotlib، Seaborn و Scikit-learn برای تحلیل و پردازش داده و پیادهسازی مدلهای یادگیری ماشین استفاده میشوند. اگر شما هم به دنیای داده و هوش مصنوعی علاقهمند هستید، این راهنما به شما کمک خواهد کرد تا مفاهیم کلیدی را یاد بگیرید.
NumPy چیست؟
NumPy (Numerical Python) یکی از مهمترین کتابخانههای پایتون برای کار با دادههای عددی و ماتریسی است. برخی از ویژگیهای اصلی آن شامل:
import numpy as np
# ایجاد آرایه
arr = np.array([1, 2, 3, 4, 5])print(arr)
Pandas چیست؟
Pandas یک ابزار قدرتمند برای پردازش و تجزیه و تحلیل دادهها در پایتون است. این کتابخانه برای خواندن، پردازش و دستکاری دادهها بهخصوص در قالب DataFrame و Series به کار میرود.
import pandas as pd# ایجاد DataFramedata = {'نام': ['علی', 'رضا', 'سارا'], 'سن': [25, 30, 22]}df = pd.DataFrame(data)print(df)
Matplotlib یک کتابخانهی قدرتمند برای رسم انواع نمودارهای دو بعدی در پایتون است. این ابزار به شما کمک میکند دادههای خود را بهصورت گرافیکی نمایش دهید.
import matplotlib.pyplot as pltx = [1, 2, 3, 4, 5]y = [10, 15, 7, 12, 20]plt.plot(x, y, marker='o')plt.xlabel("X محور")plt.ylabel("Y محور")plt.title("نمودار خطی")plt.show()
Seaborn چیست؟
Seaborn بر پایهی Matplotlib ساخته شده و امکانات بصری بیشتری برای رسم نمودارها دارد. این کتابخانه برای مصورسازی پیشرفته دادهها و ایجاد نمودارهای زیبا استفاده میشود.
import seaborn as snsimport pandas as pddf = pd.DataFrame({'گروه': ['A', 'B', 'C', 'D'], 'مقدار': [20, 35, 30, 35]})sns.barplot(x='گروه', y='مقدار', data=df)plt.title("نمودار ستونی")plt.show()
Scikit-learn چیست؟
Scikit-learn یکی از مهمترین کتابخانههای یادگیری ماشین در پایتون است. این ابزار شامل الگوریتمهای مختلفی برای طبقهبندی (Classification)، رگرسیون (Regression)، خوشهبندی (Clustering) و بسیاری دیگر است.
from sklearn.model_selection import train_test_splitfrom sklearn.linear_model import LinearRegressionfrom sklearn.metrics import mean_squared_errorimport numpy as np# ایجاد داده نمونهX = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)y = np.array([2, 4, 6, 8, 10])# تقسیم داده به آموزش و تستX_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# ایجاد مدل و آموزشmodel = LinearRegression()model.fit(X_train, y_train)# پیشبینیpredictions = model.predict(X_test)# ارزیابی مدلmse = mean_squared_error(y_test, predictions)print("Mean Squared Error:", mse)
در این مقاله، با NumPy، Pandas، Matplotlib، Seaborn و Scikit-learn آشنا شدیم. این ابزارها به شما کمک میکنند دادهها را تحلیل و پردازش کرده و مدلهای یادگیری ماشین را اجرا کنید. در مقالات بعدی به بررسی تکنیکهای پیشرفتهتر یادگیری ماشین خواهیم پرداخت.