❓ سوال:

در اجرای پروژه دوم مسیر یادگیری دیتا ساینس (بخش شیرجه در علم داده)، هنگام استفاده از oversampling برای کلاس اقلیت با RandomOverSampler از کتابخانه imbalanced-learn، با خطای ModuleNotFoundError مواجه شدم. به همین دلیل، با توجه به پیشنهاد ChatGPT، تلاش کردم دو کتابخانه scikit-learn و imbalanced-learn را با نسخه‌های خاص زیر نصب کنم:

pip install -U scikit-learn==1.3.0 imbalanced-learn==0.11.0

اما در هنگام نصب، با خطاهای اتصال و عدم تشخیص نسخه مواجه شدم.

دلیل اینکه خواستم کتابخانه‌ها را آپدیت کنم این بود که در اولین اجرا، Kaggle پیغام داد برخی کتابخانه‌ها موجود نیستند و کد اجرا نشد. حتی پس از بررسی مجدد، مشاهده کردم آخرین سلول نوت‌بوک همچنان اجرا نمی‌شود.

با وجود اینکه در محیط Kaggle کتابخانه‌ها به‌طور پیش‌فرض نصب هستند، چرا چنین خطاهایی رخ می‌دهد و برای اجرای صحیح این کد چه راه‌حلی وجود دارد؟

✅ پاسخ:

 ۱. درباره کتابخانه‌های نصب‌شده در Kaggle

محیط Kaggle به‌صورت پیش‌فرض بسیاری از کتابخانه‌های ضروری و پرکاربرد را نصب دارد، از جمله:

  • scikit-learn
  • imbalanced-learn
  • pandas, numpy, matplotlib, seaborn و …

در نتیجه در اکثر مواقع، نیازی به نصب مجدد یا آپدیت نسخه خاصی نیست.

 ۲. دلیل خطای نصب و آپدیت

وقتی تلاش کردید نسخه‌های خاصی از scikit-learn و imbalanced-learn را نصب کنید، با خطاهایی مانند Temporary failure in name resolution مواجه شدید. این خطا معمولاً به دلایل زیر رخ می‌دهد:

  • مشکلات اتصال به اینترنت یا DNS در محیط Kaggle
  • نصب همزمان نسخه‌هایی که با پکیج‌های دیگر ناسازگارند
  • نداشتن دلیل موجه برای نصب نسخه خاص

نکته مهم دیگر این است که اگر نیاز ضروری به نسخه خاصی ندارید، بهتر است اصلاً ورژن مشخص نکنید و فقط از دستور زیر استفاده کنید:

pip install -U imbalanced-learn

 ۳. خطای عدم شناسایی کتابخانه (ImportError)

اگر در محیطی مثل Kaggle کتابخانه‌ای نصب است ولی پیغام دریافت می‌کنید که شناسایی نمی‌شود، احتمال زیاد کتابخانه در آن نوت‌بوک import نشده است. توجه کنید که حتی اگر پکیج نصب باشد، تا زمانی که import صورت نگیرد، کد اجرا نخواهد شد.

بنابراین حتماً در ابتدای کد خود دستورهای زیر را وارد کنید:

from imblearn.over_sampling import RandomOverSampler
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
...

Published by

ساره واحدی
svahedi72

ساره واحدی هستم؛ دانشجوی پانزدهمین دوره "علم داده" در آکادمی دایکه، دانشجوی کارشناسی ارشد فیزیک و علاقمند به کار کردن با دیتاها