معرفی و شرح خدمات

اتاق خبر صبا، یک بسته جامع خبری است که برای پاسخ‌گویی به تمامی نیازمندی‌های یک خبرگزاری متوسط و بزرگ طراحی و پیاده‌سازی شده است. این نرم‌افزار با بهره‌گیری از جدیدترین فناوری‌های نرم‌افزاری موجود در حوزۀ وب تولید شده و در آن سهولت استفاده به عنوان مهم‌ترین هدف تولیدکنندگان مدنظر قرار گرفته است. رابط کاربری بسیار ساده است و کار با آن دلچسب.

این سامانه مبتنی بر کارتابل است و هر کاربر کارتابل مربوط به سمت یا سمت‌های خود را مشاهده می‌کند. برخی کاربران مانند دبیران و سردبیران بسته به دسترسی به سرویس‌ها و زیرسرویس‌های مشترک، اخبار مشترک را در کارتابل خود مشاهده می‌کنند و برخی در صورت اعطای دسترسی اختصاصی، کارتابل اختصاصی خود را می‌بینند.

چرخۀ کامل خبری (news workflow) که در این سامانه پیش‌بینی شده مبتنی بر نیاز یک خبرگزاری متوسط و بزرگ (با نقش‌ها و دسترسی‌های متنوعی همچون خبرنگار، دبیر، دبیر سرویس، دبیر بخش، سردبیر، سردبیر کل، مدیر اداره، مدیر آرشیو، مدیر کل، مدیر سامانه، عکاس، دبیر سرویس عکس، مدیر تبلیغات، مدیر کلیدواژه‌ها، مدیر برچسب‌ها و ...) است و دسترسی‌ها و سمت‌ها به صورت ریز قابل تفکیک و دسته‌بنده است. هر کاربر می‌تواند به یک یا چند سرویس و زیر سرویس دسترسی داشته باشد. چیدن صفحۀ اصلی سایت بر اساس دسترسی به باکس‌های خبری است که مدیر در اختیار دبیران یا سردبیران قرار می‌دهد.

این سامانه با استفاده از فناوری Java EE 6 تولید شده و امکان اجرای سرور آن بر روی کلیۀ سکوهای مورد استفاده نظیر Windows همۀ نسخه‌های از (2000 به بعد)، لینوکس (تمامی توزیع‌ها) و Apple OS X را داراست. تمامی مرورگرهای مدرن (MS Internet Explorer, Mozilla Firefox, Google Chrome, Opera) امکان دیدن صفحات سامانه را دارند. به علاوه به دلیل استفاه از میان‌افزارهای استاندارد (middleware)، امکان بهره‌گیری از اکثر پایگاه‌های دادۀ قدرتمند و مشهور نظیر MS SQL Server، Oracle Database، Oracle MySQL و PostgreSQL را دارد.

فناوری واسط کاربری بر اساس استاندارد HTML 5 و مؤلفه‌های استاندارد PrimeFaces تولید شده و بر روی مرورگرهای مدرن نظیر Chrome 5+، Firefox 3+، Safari 5+ و Internet Explorer 8+ و همچنین اکثر گوشی‌های همراه و تبلت‌ها کار می‌کند. رابط کاربری بسیار ساده و جذاب است و حدود ۳۰ مضمون/پوستۀ گرافیکی از پیش برای آن طراحی شده است.

برخی از استفاده‌کنندگان فعلی این نسخه از سامانه عبارتند از:

  • سایت و اتاق خبر خبرگزاری مهر (www.mehrnews.com)
  • سامانۀ اطلاعات و اخبار وزارت کشور (داخلی و غیر قابل دسترسی از اینترنت)
  • خبرگزاری وزارت راه و شهرسازی(new.mrud.ir)
  • پایگاه خبری بورس کالای ایران (www.imereport.ir)
  • شبکهٔ خبری سینماپرس (www.cinemapress.ir)
  • پایگاه خبری-تحلیلی نماینده (www.namayande.com)
  • پایگاه تحلیلی و اطلاع‌رسانی فرهنگ و علوم انسانی (www.farhangemrooz.com)
  • اربعین پیکس(www.arbaeenpix.com)
  • پایگاه خبری تحلیلی چشم‌اندازه ۱۴۰۴ (www.1404.ir)

همچنین سایت خبری صاحب‌خبر که به عنوان یک پایگاه خبری جمع‌آوری و ساماندهی خودکار خبری با بهره‌گیری از ربات پایش هرمس عمل می‌کند، خروجی و پنل مدیریتی را در سایت قالب اتاق خبر ارائه می‌دهد. (www.sahebkhabar.ir)

چکیده‌ای از امکانات

  • پوشش کامل چرخۀ تولید خبری
  • مبتنی بر کارتابل
  • انبارۀ متمرکز انواع فایل‌
  • مدیریت باکس‌های منعطف نمایشی خبری (تعریف و جانمایی انواع باکس نمایشی خبر نظیر آخرین اخبار، پربازدیدترین، تبلیغ، نظرسنجی و ...)
  • موتور جستجوی قدرتمند نستوه با قابلیت‎های متعددی من‌جمله فهم زبان فارسی، شباهت یابی و مفهوم یابی.
  • استقرار توزیع شده بر روی سرورهای متعدد در مناطق جغرافیایی متفاوت
  • تاریخچۀ تغییرات خبر
  • افزودن فیلدهای دلخواه خبری (تعریف تعداد نامحدود قلم اطلاعاتی برای هر خبر)
  • ویراستار خودکار آیین نگارش خبر
  • اطلاعات جغرافیایی خبر GIS
  • مدیریت کاربران و دسترسی‌ها (تعریف منعطف هر گونه نقش با دسترسی دلخواه)
  • نوع خبر
  • منبع خبر
  • مناطق خبری (به صورت درخت چند سطحی)
  • کلیدواژه‌های خبری (چندسطحی با قابلیت ادغام)
  • پرونده‌های خبری
  • بولتن و خبرنامه
  • آمار و گزارش‌ها
  • تبلیغات با امکانات حرفه‌ای
  • نظرسنجی
  • آرشیو پیشرفته
  • امکانات آنلاین ویرایش عکس
  • ثبت سابقه
  • کاربران برخط (online)
  • اخبار چندرسانه‌ای
  • یادداشت (کامنت)
  • خبرهای مشابه (دستی و خودکار)
  • ارائه‌ی سرویس‌های RESTful
  • مدیریت امنیتی لایه‌ای

مقدمه و کلیات سامانه

از مهم‌ترین نیازمندی‌های یک سازمان، اولاً آگاهی از اخبار عمومی و روز ایران و جهان و ثانیاً و مهم‌تر از آن، آگاهی و تحلیل اخبار اختصاصی و مرتبط با آن سازمان است. بسیاری از سازمان‌های دانش‌محور، حاکمیتی، مشاوره‌ای، آموزشی و پژوهشی هم از بعد رسالت خود و هم آگاهی از اوضاع و احوال مرتبط با سازمان خود به اخبار خبرگزاری‌ها نیازمندند. روشی که به طور سنتی در این حوزه مورد استفاده قرار می‌گرفته است، بهره بردن از نیروی انسانی برای مرور و یافتن اخبار مرتبط با سازمان بوده است. در این روش کار به شیوه‌های دستی و نیمه‌خودکار انجام می‌شود. به عنوان مثال کارشناس مربوطه در موتورهای جستجوی عمومی یا خبرگزاری‌های مورد نظر به جستجوی اخبار مورد نظر خود می‌پرداخته. این روش هزینه و دشواری فراوانی دارد. از جمله عوامل مشکل‌زای این روش می‌توان به: نبود امکان جستجوی یکپارچه، مشکلات فنی پایگاه‌های خبری، عدم امکان دسته‌بندی و مرور یکجای اخبار و همچنین نبود امکان فیلترینگ جامع و یکپارچه بر روی اخبار اشاره کرد.

سامانۀ رصد و پایش اخبار «هرمس» با هدف پوشش تمامی نیازهای یک روابط عمومی دیجیتال طراحی و پیاده‌سازی شده است. این سامانه با رصد ۲۴×۷ پایگاه‌های خبری داخلی و خارجی امکان پایش برخط و آنی آخرین رویدادهای ایران و جهان و همچنین آخرین تولیدات رسانه‌ای مرتبط با یک سازمان را فراهم می‌کند. هرمس یک ربات پویشگر و تحلیلگر وب است که در حال حاضر برای دریافت و نمایه‌سازی اخبار و آنچه به خبر مرتبط است، طراحی شده، اما قابلیت دریافت و ذخیرۀ هرگونه محتوای دیجیتالی را داراست.

شرح فعالیت

ساختار کلی روبات پویشگر هرمس در یک نگاه کلی بصورت شکل روبرو طراحی شده است. این ربات به طور شبانه‌روزی به رصد پایگاه‌های خبری داخلی و خارجی می‌پردازد و پس از ذخیره‌سازی انواع محتوا اعم از متنی و چندرسانه‌ای، شروع به آنالیز و تحلیل محتوا با فاکتورهای متعدد خود می‌نماید. در انتها خروجی خود را در یک و یا چند قالب زیر ارائه می‌نماید:
۱. سامانه رصد آنلاین
۲. بولتن قابل چاپ
۳. پیامک
۴. رایانامه (ایمیل)

یک نمونه‌ی فعال از این سامانه در حال حاضر بر روی پایگاه خبری صاحب‌خبر به نشانی www.sahebkhabar.ir نصب شده است و فعلاً برای تمامی کاربران اینترنت قابل دسترس است.

نمونه بولتن‌های روزانه، ماهانه و تحلیل محتوا

نمونه یک بولتن روزانه را می‌توانید از این آدرس دریافت کنید. (حجم ۲۵م‌)
یکی از انواع بولتن‌های دیجیتال با قابلیت چاپ و نمایش واکنش‌گرا (ریسپانسیو) در انواع دستگاه‌های موبایل، تبلت و رایانه رومیزی بولتن موضوعی روزانه است.
این بولتن روزانه به صورت خودکار یا دستی تولید می‌شود و در آن اقلام مختلف در موضوعات مورد علاقه‌ی مشتری گردآوری می‌شوند.
از جمله اقلام گردآوری شده می‌توان به صفحه اول روزنامه‌ها، اخبار سایت‌های خبری و خبرگزاری‌ها، بریده‌ی روزنامه‌ها به همراه متن کامل آن‌ها و ... اشاره کرد.

نمونه یک بولتن تحلیل محتوای ماهانه را می‌توانید از این آدرس دریافت کنید. (حجم ۱م‌)
این بولتن چکیده تحلیلی و سطح بالایی از اخباری است که روزانه در قالب بولتن‌های دیجیتال موضوعی در اختیار مخاطب قرار می‌گیرد.
در این بولتن به تفکیک منابع خبری و زیرموضوعات بولتن جزئیات آمار تولید ارائه شده است. برخی اقلامی که با نگاه به این بولتن مشخص می‌شود: ۱. پرتولیدترین سایت خبری، خبرگزاری یا روزنامه در موضوعات خبری بولتن.
۲. پرخبرترین روز.
۳. پرتیراژترین اخبار بولتن.
۴. تعداد کل اخبار ماهانه به تفکیک موضوع

نمونه یک بولتن خاص مناسبتی را می‌توانید از این آدرس دریافت کنید. (حجم ۱م‌)
این بولتن فشرده‌ی اخبار پوشش داده شده در یک موضوع خاص خبری برای یک بازه مشخص است.
به عنوان مثال این بولتن اخبار پوشش داده شده‌ی توافق ژنو / لوزان را به تفکیک خبرگزاری‌های برتر ایران ارائه می‌کند.

نمونه یک بولتن تحلیل بازتاب ماهانه را این آدرس دریافت کنید. (حجم ۱م‌)
این بولتن که در قالب یک بسته‌ی خبری با حدود ۳۰ گزارش متنوع به مشتری‌ها، که عمدتاً خود تولیدکنندگان اصلی خبر کشور هستند، عرضه می‌شود برخی اقلام اطلاعاتی را که اختصاصا سامانه‌ی هرمس قادر به تولید آن است ارائه می‌کند. در این بسته‌ی تحلیلی اخبار بازتابی منابع اصلی در سایر منابع داخلی و بیگانه ارائه می‌شود. این بازتاب به تفکیک سایت خبری، روزنامه و سایر خبرگزاری‌های بازتاب‌دهنده به ارائه آمار می‌پردازد. برخی اقلام آماری که در این گزارش ارائه می‌شود عبارت است است:
۱. مقایسه‌ی میزان تولید کل خبرگزاری‌ها.
۲. مقایسه‌ی رتبه‌ی خبرگزاری‌ها به لحاظ بازتاب اخبار آن‌ها به طور کلی.
۲.۱. مقایسه‌ی رتبه‌ی خبرگزاری‌ها به لحاظ بازتاب اخبار آن‌ها در روزنامه‌ها.
۲.۱.۱. مقایسه‌ی رتبه‌ی خبرگزاری‌ها به لحاظ بازتاب اخبار آن‌ها در صفحه‌ی اول روزنامه‌ها.
۲.۲. مقایسه‌ی رتبه‌ی خبرگزاری‌ها به لحاظ بازتاب اخبار آن‌ها در سایت‌های خبری داخلی.
۲.۳. مقایسه‌ی رتبه‌ی خبرگزاری‌ها به لحاظ بازتاب اخبار آن‌ها در سایت‌های خبری بیگانه.
۳. مقایسه‌ی سرویس‌ها و گروه‌های خبری به تفکیک بازتاب در سایت‌های داخلی، بیگانه و روزنامه‌ها.
۴. مقایسه‌ی تعداد اخبار تعلیقی و حذفی به تفکیک سرویس.
۵. مقایسه‌ی تعداد اخبار تغییریافته پس از انتشار. ارائه‌ی آماره‌ی ضریب تغییر.
۶. ارائه‌ی آماره‌ی ضریب بازتاب برای نشان دادن میزان اخبار بازتاب یافته برحسب تولید.
این بولتن فشرده‌ی اخبار پوشش داده شده در یک موضوع خاص خبری برای یک بازه مشخص است.
به عنوان مثال این بولتن اخبار پوشش داده شده‌ی توافق ژنو / لوزان را به تفکیک خبرگزاری‌های برتر ایران ارائه می‌کند.

قابلیت ها

ربات هرمس به طور مکرر و در بازه‌های زمانی معین (بر اساس اهمیت پایگاه خبری) به پایگاه‌های خبری و روزنامه‌ها سر می‌زند و تمامی فیلدهای خبری از جمله تیتر، عکس، روتیتر، بدنه، کلیدواژه و لید را استخراج می‌کند. ربات هرمس، همچنین می‌تواند هرگونه محتوایی در قالب‌های متنوعی نظیر HTML, RSS, IMAGE, MOVIE را دریافت کند.

این سامانه علاوه بر اینکه می‌تواند نسخه RSS اخبار را ذخیره کند، همچنین نسخه اصلی منتشره در وب سایت را بصورت کامل، با استفاده از ربات خزنده خود ذخیره و آنالیز می‌نماید. صفحات شروع برای عملیات خزش، می‌تواند هر صفحه‌ای اعم از صفحه اصلی ویا صفحات آرشیو باشد.

از مزیت‌های هرمس، قابلیت اتصال آن به سامانه‌ی اتاق خبر و سایت خبری است، که نمونه‌ی آن هم‌اکنون روی سایت صاحب‌خبر قابل دسترس است. کاربر سامانه می‌توان با بهره‌گیری از هرمس و اتاق خبر هر تعداد خبر مهم را از هرمس اخذ کند و به طور سیستماتیک به در سایت خود بازنشر دهد. به این ترتیب سرعت انتشار خبر به طور چشم‌گیری با کمترین هزینه‌ی نیروی انسانی افزایش می‌یابد. همچنین کاربر می‌تواند خبرهای هرمس را به کارتابل خود منتقل کند و پس از اعمال تغییرات دلخواه، آن‌ها را بر روی خروجی خود منتشر کند.

با هر نوع تحلیل آماری و متنی، امکان ارسال اخبار و یا نتایج تحلیل‌ها بوسیله پیامک و ایمیل وجود دارد. مثلاً ارسال پیامکی آخرین اخبار سرویس فرهنگی یک خبرگزاری، پرتیراژترین اخبار ورزشی روز کشور، جریان‌های خبری داغ، کپی اخباری که سایت ما منتشر کرده‌اند و ....

امکان ذخیره‌ی تمام تغییرات اعمال‌شده روی اخبار پس از انتشار وجود دارد. به بیان دیگر هرمس قابلیت ذخیره‌ی تاریخچه‌ای از تغییراتی که روی هر خبر اعمال می‌شود را دارد و در صورت نیاز مدیر سامانه می‌تواند تمامی تغییراتی که ناشر از هنگام انتشار روی خبر اعمال کرده است را رصد کند. در نمایش تغییرات، بخش تغییر داده شده از متن، بصورت پررنگ و درکنار بخش قبلی کاملاً متمایز خواهد شد.

هرمس با تکنیک‌های مختلف حذف خبر از روی یک پایگاه خبری را تشخصی می‌دهد و برای احترام به آن پایگاه خبری، خبر را از خروجی صاحب‌خبر نیز حذف می‌کند. به این ترتیب هرمس روزانه گزارشی از خبرهایی که هر خبرگزاری از خروجی خود حذف کرده است را ارائه می‌دهد.

در حال حاضر هرمس بیش از ۱۶۰ خبرگزاری، روزنامه و پایگاه خبری را مورد پوشش قرار داده که فهرستی از منابع داخلی آن در سایت صاحب‌خبر در بخش پایینی سایت، بخش منابع قابل مشاهده است. این منابع با سه معیار اعتبار خبری، داشتن تولید اختصاصی و همچنین داشتن حداقلی از بازدید روزانه و رتبه‌ی بازدید در ایران انتخاب شده‌اند. به علاوه حدود ۲۰ منبع بیگانه‌ی فارسی‌زبان نیز در حال حاضر توسط سامانه مورد پوشش قرار دارد. لازم به توضیح است که که این پایگاه‌ها بر اساس نیاز مشتری به هر تعداد قابل افزایش است.

از قابلیت‌های برجستجه‌ و منحصر به فرد این سامانه که به‎دلیل وجود زیرساخت قوی موتور جستجوی بومی، طراحی و تولید آن ممکن شده است، امکان یافتن خودکار اخبار مشابه و اخبار کپی‌شده و بازنشر شده با قابلیت ارائۀ منبع اصلی خبر (اولین منتشر کننده) است. در رسانه‌های فارسی‌زبان کنونی، متأسفانه بسیاری از آن‌ها صرفاً با تغییر در جمله‌ها و تغییر تیتر خبر، به بازنشر اختصاصی خبر می‌پردازند که این بازنشر از چشم هرمس پنهان نمی‌ماند.

با الگوریتم پیش‌بینی شده، بر اساس شباهت تیتر و لید و متن اصلی و کلیدواژه‌های خبر به درصد تشابه خبرها پی می‌برد. این امکان به ویژه به کمک روابط عمومی‌ها و تولیدکنندگان خبر می‌آید و آن‌ها را از بازخورد خبری اخبار خود در دیگر رسانه‌ها مطلع می‌کندو نیز مشخص می‌گردد که خبر تولیدی ما، در زنجیره گردش این خبر در دیگر خبرگزاری‎ها، رتبه چندم را به لحاظ سرعت در اطلاع‌رسانی داراست.

از آنجایی که برخی پایگاه‌ها سرویس خبری خود را ارائه نمي‌کنند و عدم همخونی و انسجام معنایی میان سرویس‌های خبری مابین پایگاه‌های خبری وجود دارد، هرمس در صورت فقدان سرویس خبری به طور خودکار از روی محتوای خبر، سرویس خبر را حدس می‌زند. در این فرایند از الگوریتم‌های NLP برای زبان فارسی استفاده شده است.

تمامی اخبار دریافتی در موتور جستجو نمایه می‌شوند. در این سامانه امکان جستجوی ساده و پیشرفته با قابلیت محدودسازی زمان تولید یا بازیابی خبر، پایگاه خبری، جستجو در فیلدهای خبری همچون: عنوان، لید، بدنه، نویسنده، یادداشت کاربران، کلیدواژه‌ها و سرویس خبری وجود دارد. در تولید این موتور، از شناخته‌شده ترین موتور منبع‌باز موجود یعنی Apache Solr استفاده شده‌است و با توسعه آن و افزودن بخش‌هایی نظیر آنالیزور زبان فارسی، محصولی با ویژگی‌های کلی زیر تولید شده‌است:
آنالیزور زبان فارسی کاملاً اختصاصی با امکاناتی نظیر:
1- ریشه‌یاب زبان فارسی (Persian Stemmer)
2- فهم اشتقاق افعال فارسی و عربی دارای کاربرد در فارسی
3- استخراج ریشه اسامی از اسم جمع بسته‌شده و ذخیره ریشه و نام اصلی با اولویت‌های متفاوت
4- امکان چشم‌پوشی از حروف و کلمات خاص در جستجوگر و نمایه‌سازی
5- امکان استخراج اصل اسامی دارای پیشوند‌ و پسوند
6- امکان استخراج مفردات از جمع‌های با قاعده
7- استخراج ریشه اسامی از جمع های مکسر
8- حذف اعراب‌های از پیش معین از واژه‌ها
9- فهم لغات چنداملایی
10- دارای بانک استثنائات برای واژگان بی‌قاعده
11- دارای بانک کلیدواژه‌های مرتبط با قابلیت توسعه

هرمس تمام فیلدهای یک خبر را بصورت کاملاً مجزا ذخیره‌سازی می‌کند که بدین وسیله می‌توانیم وزن جستجوها را در فیلدهای مختلف تغییر دهیم ویا اساساً روی فیلدهای خاصی جستجو انجام دهیم. اهم این فیلدها عبارتست از: عنوان، روتیتر، زیرتیتر، لید، بدنه‌ی خبر، جایگاه خبر در سایت مبدأ (مثلاً در تیتریک است یا در پربیننده‌ها یا ...)، کلمات کلیدی، سرویس خبری، عکس‌های خبر، سازنده، تاریخ انتشار، تاریخ تغییر، تغییرات انجام شده، اخبار مرتبط، کامنت‌های منتشره.

هرمس بر خلاف دیگر نمونه‌های داخلی و خارجی قابلیت استخراج زمان دقیق «انتشار خبر» را از خروجی خبرگزاری‌ها دارد. نرم‌افزارهای مشابه صرفاً می‌توانند زمان دریافت خبر را ذخیره کنند و یا زمان انتشار را از روی RSS استخراج کنند، در حالی که هرمس برای استخراج زمان انتشار خبر نیازی به RSS ندارد و می‌تواند آن‌را از تاریخ درج شده در کنار هر خبر استخراج کند.

هرمس به هیچ عنوان بار اضافی‌ای بر سرورهای سایت‎های خبری تحمیل نمی‌کند تا بتواند حداکثر پایداری خود را خوانش اخبار از آن سایت‎ها حفظ کند.

هرمس می‌تواند خبرهایی که در تیتر یک، تیتر دو، تیتر سه، پیشنهاد سردبیر، پربازدید، پربحث و ... هر خبرگزاری آمده است را تشخیص دهد و جایگاه مبدأ آن‌را ذخیره کند.‍ در مورد روزنامه‌ها سامانه به طور خودکار بریده‌جراید مرتبط با مطلب روزنامه را نیز دریافت می‌کند.

با این امکان خاص، می‌توان اولویت نمایش اخباری را که مثلاً در تیتریک منتشر شده‌اند بالا برد و در تحلیل و ارائه اطلاعات آماری، به دقت بسیار بالاتری دست یافت.

با بهره‌گیری از موتور جستجو و همچنین الگوریتم هوشمند یافتن خبرهای مشابه، هرمس مهم‌ترین خبرها، و به بیان دیگر، پر تیراژترین اخبار را تشخیص می‌دهد و به کاربران عرضه می‌کند. این خبرها، خبرهایی هستند که پس از انتشار اولیه در یک منبع، در منابع متعددی بازنشر شده‌اند و به همین دلیل می‌توان گفت اهمیت زیادی دارند.

مهم‌ترین جریانات خبری، از کلیدواژه‌های پرکاربرد اخبار استخراج می‌شوند. این جریانات و کلمات مهم خبری به تفکیک سرویس قابلیت نمایش دارند.