بخش عمده ای از داده های مرتبط با مشترکین اپراتورها شرکت های حوزه تلکام را می توان در دو دسته کلی جای داد:
- داده های جزئیات تماس ها
- داده های مشترکین
داده های جزئیات تماس ها
این مجموعه از داده ها حداقل دارای شماره مبدا و مقصد هر تماس، طول مکالمه به همراه تاریخ و زمان هر تماس می باشند. این بخش از داده ها عموما دارای حجم بسیار زیادی بوده و در هر ماه میلیون ها رکورد را در خوی جای می دهد. استفاده از داده های ثبت شده چندین ماه بعضا منجر به مجموعه داده ای شامل ده ها یا صدها میلیون رکورد می گردد. در صورتیکه در اغلب مسائل داده کاوی نیازی به این داده های خام نمی باشد.
تعیین الگوی تماس مشترکین در بسیاری از موارد مستلزم استفاده از اطلاعات تجمیع شده این بخش از داده ها می باشد. در واقع اطلاعات خلاصه شده مجموع تماس های هر مشترک در یک بازه زمانی به عنوان ویژگی های رفتاری آن مشترک استخراج شده و برای تعیین الگو ها مورد استفاده قرار می گیرد.
بطور مثال با استفاده از داده های خام شماره مبدا و مقصد هر تماس، طول مکالمه به همراه تاریخ و زمان هر تماس می توان اطلاعات زیر را برای هر مشترک به راحتی استخراج نمود:
- مجموعه دقایق مکالمه در زمان های عادی
- مجموعه دقایق مکالمه در زمان های دارای طرح تخفیف
- مجموعه دقایق مکالمه در شب
- مجموعه دقایق مکالمه در زمان های اوج ترافیک
- تعداد تماس های بی پاسخ
- نسبت تماس های داخل شبکه
- نسبت تماس های خارج از شبکه
- نسبت تماس های گرفته شده در ساعات اداری
- نسبت تماس های گرفته شده در روزهای اداری
- میانگین تعداد تماس های ورودی در هر روز
- میانگین تعداد تماس های خروجی در هر روز
- و ….
شاخص های رفتاری بدست آمده می تواند در تعیین الگوی مشترکین وفادار، ریزش شده، با ارزش، متخلف، تجاری و … مورد استفاده قرار گیرد.
داده های مشترکین
اطلاعات دموگرافیک از مشترکین بخش مهمی دیگری از داده های موجود در اپراتورها و شرکت های حوزه تلکام می باشد. علا.وه بر بررسی الگوهای کلی مشترکین بر اساس ویژگی هایی مانند جنسیت، سن و … می توان به بررسی چگونگی تاثیر آنها بر رفتار تماس نیز پرداخت.
بنابراین در اغلب موارد این داده ها می تواند به عنوان مکمل داده های جزئیات تماس ها در کشف الگو ها مورد استفاده قرار گیرد.