PYTHON Tutorial

معالجة البيانات

المقدمة

معالجة البيانات عملية أساسية في العديد من المجالات، مثل علوم البيانات والتحليل المالي. توفر لغة بايثون مجموعة واسعة من الأدوات والمكتبات لمعالجة البيانات بسهولة وفعالية.

المكتبات الأساسية

  • بانداس (Pandas): مكتبة لإنشاء هياكل بيانات من نوع "الإطار البيانات" (DataFrame) لتمثيل جداول البيانات.
  • نومبي (NumPy): مكتبة لمعالجة المصفوفات متعددة الأبعاد.
  • سي إس في (CSV): مكتبة لقراءة وكتابة ملفات القيم المفصولة بفواصل.
  • جيسون (JSON): مكتبة لقراءة وكتابة البيانات بتنسيق JSON (نموذج تبادل البيانات).

خطوات معالجة البيانات

  • استيراد البيانات: يمكنك استيراد البيانات من ملفات نصية أو قواعد بيانات أو مصادر أخرى باستخدام مكتبات مثل CSV و JSON.
  • تنظيف البيانات: إزالة البيانات الخاطئة أو المفقودة أو غير المتسقة.
  • التحويل والإصلاح: تحويل البيانات إلى التنسيق المطلوب أو ملء القيم المفقودة.
  • دمج البيانات: دمج بيانات من مصادر مختلفة.
  • التحليل: استخدام الأدوات الإحصائية ومكتبات التصور لتلخيص البيانات وإيجاد أنماط و اتجاهات.

مثال بايثون

هذا المثال يوضح كيفية استخدام مكتبة بانداس لإنشاء إطار بيانات من ملف CSV وتحليل البيانات:

import pandas as pd

# قراءة البيانات من ملف CSV
df = pd.read_csv("بيانات.csv")

# عرض إطار البيانات
print(df)

# حساب المتوسطات
print("المتوسطات:", df.mean())

# إنشاء رسم تخطيطي
df.plot.scatter(x="x", y="y")
plt.show()

خاتمة

توفر لغة بايثون أدوات قوية لمعالجة البيانات يمكن استخدامها لحل مجموعة واسعة من المهام. باستخدام المكتبات الأساسية مثل بانداس ونومبي و CSV و JSON، يمكنك بسهولة استيراد البيانات وتنظيفها وتحويلها وتحليلها.