پردازش داده و یادگیری ماشین با پایتون

ایجاد شده توسط دکتر مصطفی جلیلی در آموزش برنامه نویسی پایتون 13 مارس 2025
اشتراک گذاری

پردازش داده و یادگیری ماشین با پایتون


 ابزارهایی مانند NumPy، Pandas، Matplotlib، Seaborn و Scikit-learn برای تحلیل و پردازش داده و پیاده‌سازی مدل‌های یادگیری ماشین استفاده می‌شوند. اگر شما هم به دنیای داده و هوش مصنوعی علاقه‌مند هستید، این راهنما به شما کمک خواهد کرد تا مفاهیم کلیدی را یاد بگیرید.


معرفی کتابخانه‌های NumPy و Pandas


NumPy چیست؟


NumPy (Numerical Python) یکی از مهم‌ترین کتابخانه‌های پایتون برای کار با داده‌های عددی و ماتریسی است. برخی از ویژگی‌های اصلی آن شامل:



  • آرایه‌های چندبعدی پرسرعت

  • عملیات ریاضی و آماری پیشرفته

  • توابع برداری و ماتریسی


نصب و استفاده از NumPy


import numpy as np

# ایجاد آرایه
arr = np.array([1, 2, 3, 4, 5])
print(arr)

Pandas چیست؟


Pandas یک ابزار قدرتمند برای پردازش و تجزیه و تحلیل داده‌ها در پایتون است. این کتابخانه برای خواندن، پردازش و دستکاری داده‌ها به‌خصوص در قالب DataFrame و Series به کار می‌رود.


نصب و استفاده از Pandas


import pandas as pd
# ایجاد DataFrame
data = {'نام': ['علی', 'رضا', 'سارا'], 'سن': [25, 30, 22]}
df = pd.DataFrame(data)
print(df)

مصورسازی داده با Matplotlib و Seaborn

Matplotlib چیست؟



Matplotlib یک کتابخانه‌ی قدرتمند برای رسم انواع نمودارهای دو بعدی در پایتون است. این ابزار به شما کمک می‌کند داده‌های خود را به‌صورت گرافیکی نمایش دهید.


مثال ساده از Matplotlib


import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [10, 15, 7, 12, 20]
plt.plot(x, y, marker='o')
plt.xlabel("X محور")
plt.ylabel("Y محور")
plt.title("نمودار خطی")
plt.show()

Seaborn چیست؟


Seaborn بر پایه‌ی Matplotlib ساخته شده و امکانات بصری بیشتری برای رسم نمودارها دارد. این کتابخانه برای مصورسازی پیشرفته داده‌ها و ایجاد نمودارهای زیبا استفاده می‌شود.


مثال از Seaborn


import seaborn as sns
import pandas as pd
df = pd.DataFrame({'گروه': ['A', 'B', 'C', 'D'], 'مقدار': [20, 35, 30, 35]})
sns.barplot(x='گروه', y='مقدار', data=df)
plt.title("نمودار ستونی")
plt.show()

مقدمه‌ای بر یادگیری ماشین با Scikit-learn


Scikit-learn چیست؟


Scikit-learn یکی از مهم‌ترین کتابخانه‌های یادگیری ماشین در پایتون است. این ابزار شامل الگوریتم‌های مختلفی برای طبقه‌بندی (Classification)، رگرسیون (Regression)، خوشه‌بندی (Clustering) و بسیاری دیگر است.


مثال از یادگیری ماشین با Scikit-learn


from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
import numpy as np
# ایجاد داده نمونه
X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)
y = np.array([2, 4, 6, 8, 10])
# تقسیم داده به آموزش و تست
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# ایجاد مدل و آموزش
model = LinearRegression()
model.fit(X_train, y_train)
# پیش‌بینی
predictions = model.predict(X_test)
# ارزیابی مدل
mse = mean_squared_error(y_test, predictions)
print("Mean Squared Error:", mse)

جمع‌بندی


در این مقاله، با NumPy، Pandas، Matplotlib، Seaborn و Scikit-learn آشنا شدیم. این ابزارها به شما کمک می‌کنند داده‌ها را تحلیل و پردازش کرده و مدل‌های یادگیری ماشین را اجرا کنید. در مقالات بعدی به بررسی تکنیک‌های پیشرفته‌تر یادگیری ماشین خواهیم پرداخت.

نظرات (0)

اشتراک گذاری

این پست را با دیگران به اشتراک بگذارید

تنظیمات GDPR

When you visit any of our websites, it may store or retrieve information on your browser, mostly in the form of cookies. This information might be about you, your preferences or your device and is mostly used to make the site work as you expect it to. The information does not usually directly identify you, but it can give you a more personalized web experience. Because we respect your right to privacy, you can choose not to allow some types of cookies. Click on the different category headings to find out more and manage your preferences. Please note, that blocking some types of cookies may impact your experience of the site and the services we are able to offer.