کدک فشرده سازی دوربین مداربسته

D
پویش رایان داتیس
مطالعه حدود 0 دقیقه
10 0
کدک فشرده سازی دوربین مداربسته
راهنمای مطالعه
فشرده سازی و از فشرده خارج کردن ویدیو
فشرده سازی بر اساس Inter و Intra
اسمارت کدک یا فشرده سازی هوشمند
کدک‌های آینده

کدک‌ یا کدگذاری به‌عنوان قلب یک سیستم نظارت تصویری شناخته می‌شود. نام‌هایی مانند H.264، H.265 و MJPEG عموما برای فشرده‌سازی تصویر دوربین مدار بسته استفاده می‌شود. آن‌ها چطور کار می‌کنند؟ چرا باید از Codec استفاده کنیم؟ با چه مشکلی احتمالا مواجه می‌شویم؟ در این مقاله با ما همراه باشید تا با بخش دیگری از عملکرد دوربین مداربسته آشنا شویم. 

فشرده سازی و از فشرده خارج کردن ویدیو

در حالت فشرده، استوریج و ترافیک شبکه تا 100 برابر کمتر مصرف می‌شوند. اساسا باید تمامی ویدیوهای نظارت تصویری فشرده ‌شوند. هنگامی که تصویر دیجیتایز می‌شود، اصولا در ابتدا فشرده نمی‌شود. سه فاکتور اصلی در سایز ویدیوهای غیر فشرده وجود دارد:

  1. رنج مقادیر هر پیکسل 
  2. تعداد کل پیکسل‌های هر فریم 
  3. تعداد کل فریم‌ها در هر ثانیه 

در ادامه در مورد هر کدام مجزا و مفصل صحبت کرده‌ایم:

مقادیر پیکسل‌ها 

به هر پیکسل، مقداری(ارزشی) داده می‌شود که با عددی در یک بازه، نمایش داده می‌شود. بازه تعیین می‌کند که چقدر رنگ را می‌توان دقیقا تعریف کرد. همچنین بر این میزان بر پهنای باند/اندازه نیز تاثیر می‌گذارد. 

  • مقیاس خاکستری را در نظر بگیرید. اغلب دارای بازه‌ای از 256 (8 بیت) است. عدد صفر نشان‌دهنده سیاه ، عدد 255 نشان‌دهنده سفید و اعداد بین آن‌ها نشان‌دهنده سایه‌های خاکستری هستند. 
  • البته، تقریبا همه تصاویر نظارت تصویری از رنگ پشتیبانی می‌کنند. پس رنج مقادیر موردنیاز برای نمایش همه رنگ‌ها بسیار بیشتر است. 16 بیت یا 65536 عادی هست. 

رزولوشن تصویر و فریم ریت

رزولوشن تصویر و فریم ریت

درک دو عامل دیگر بسیار آسان است. رزولوشن دوربین و تعداد پیکسل‌های افقی عمودی. تعداد فریم در ثانیه، 1، 10، 30 ... هست. اکثریت قریب به اتفاق دوربین‌های مداربسته، بین 5 تا 15 فریم در ثانیه ضبط می‌کنند. 

مثال عالی از تصویری که فشرده نیست

آنچه در اینجا بسیار مهم است، تشخیص این نکته هست که تصاویر فشرده نشده چقدر می‌توانند بزرگ شوند. برای مثال یک دوربین رنگی با رزولوشن 1080P با سرعت 30 فریم در ثانیه را در نظر بگیرید:

دوربین رنگی با رزولوشن 2MP

با ضرب این سه فاکتور در هم، حدود 1 گیگابیت در ثانیه ویدیو غیر فشرده داریم. در یک روز، شما باید حدود 12 ترابایت، فضا نیاز دارید. در حالی‌که هارددیسک‌ها همچنان ظرفیتشان بالاتر می‌رود، سیستم نظارت تصویری غیر فشرده با 16 دوربین به مدت 30 روز ذخیره می‌شوند. این به تعداد زیادی هارد و هزینه‌ی سرسام آوری برای خرید آن نیاز دارد. 

کدک‌ها کلیدی هستند

علی‌رغم سایز بالای ویدیوهای غیر فشرده، محصولات نظارت تصویری برای 16 دوربین، بطور معمول در کامپیوترهای استاندارد یا روی دستگاه‌ ضبط تصویر ذخیره می‌شوند. پس راهکار برای حل این مشکل چیست؟ کدک‌ها. 

کدک مخفف فشرده‌سازی / از فشرده خارج کردن تصویر است.

عمل فشرده‌سازی، عنصر اصلی کاهش مصرف پهنای باند/ذخیره سازی است. اختصاص مقدار(ارزش) منحصر بفرد به هرپیکسل از هر فریم، کاری بیهوده است. زیرا بیشتر صحنه‌ها با تعداد کمی از رنگ‌های مشابه پر شده‌اند. کدک‌ها، ویدیو را با کاهش تعداد مقدار ضبط، فشرده می‌کنند. در حین ردیابی اینکه کدام پیکسل‌ها دارای مقادیر یکسان و مشابه هستند، به آن اجازه می‌دهد تا مقادیر بسیار کمتری از هر بیت‌ها را ارسال کند. 

فشرده سازی بر اساس Inter و Intra

دو نوع رویکرد برای فشرده‌سازی وجود دارد:

  • اینترافریم.
  • اینترفریم. 

درک تمایزات بین این دو تاثیر پهنای باند مصرفی، توان پردازشی مورد نیاز و کیفیت ریسک را در بردارد.  

  • فشرده سازی اینترافریم در یک تک فریم رخ می‌دهد. اما در کل فریم نیست.(مانند Mjpeg)
  • فشرده‌سازی اینترفریم در چندین فریم است. (H.264,H.265, …)

همه‌ی کدک‌ها از فرمت اینترافریم پشتیبانی می‌کنند، اما برخی فقط از هر دو اینترا و اینترفریم پشتیبانی می‌کنند. 

فشرده سازی اینترافریم

اینترافریم فقط به یک فریم و در یک لحظه نگاه می‌کند. تمام تلاش خود را برای فشرده‌سازی آنچه در آن تصویر است، انجام می‌دهد. حتی گفته می‌شود که یک ویدیو، تعدادی تصویر هستند، که فشرده‌سازی اینترافریم فقط در یک فریم و در یک لحظه رخ داده و استریم نادیده گرفته می‌شود. فریم‌های مجزای استریم‌های کدک اینترافریم شبیه فریم‌های یک فیلم هستند:

فشرده سازی اینترافریم

جنبه مثبت این کار بصورت محاسباتی ساده است و ویدیو را به میزان قابل توجهی فشرده می‌کند. برای نمونه، یک استریم ویدیویی با رزولوشن 1080 و 30 فریم در ثانیه، از یک فشرده سازی اینترا فریم شبیه MJPEG بیت ریت کمتر از 1000 مگابیت در ثانیه تا 40 مگابیت در ثانیه را کاهش می‌دهد. با این حال، نقطه ضعف این هست که اگر بین فریم‌ها مقایسه انجام شود، حتی save بیشتری نیز در دسترس است. 

فشرده‌سازی اینترفریم

با استفاده از فشرده‌سازی اینترفریم، نه تنها ویدیوی درون فریم کدگذاری می‌شود، بلکه کدک فریم‌های مجاور را برای فشرده‌سازی بیشتر تصویر، مقایسه می‌کنند. این مورد به دلیل تغییرات اندک از یک فریم به فریم بعدی رخ خواهد داد. برای مثال، یک شخص متحرک در یک صحنه مشابه، با فشرده‌سازی اینترفریم، فقط یک بازوی شخص را ارسال می‌کند. 

فشرده‌سازی اینترفریم

با توجه به باقی ماندن قسمت‌های زیادی از یک صحنه معین، تنها تغییرات در صحنه ارسال شده و سبب صرفه‌جویی در پهنای باند و فضای ذخیره‌سازی خواهد شد. 

برای مثال، استریم 1080P با 30 فریم در ثانیه، احتمالا به 40 مگابیت در ثانیه با فرمت MJPEG نیاز دارد. یک کدک اینترافریم فقط احتمالا به 4 مگابیت در ثانیه با فرمت H.264 نیاز دارد، کدکی که از هر دو استفاده می‌کند. به هرحال، نقطه ضعف اصلی در فشرده‌سازی اینترفریمی این هست که از نظر محاسباتی بسیار فشرده‌تر است. که این می‌تواند روی کیفیت تصویر تاثیر بگذارد. این را در ادامه بررسی خواهیم کرد. 

فریم‌های I و P

دو نوع فریم در فشرده‌سازی اینترافریم مانند H.264 و H.265 وجود دارد. I و P. 

فریم‌های I

اولین فریم در یک گروه تصویری آی فریم نامیده می‌شود. بصورت اختصار عبارت intra-codec. اساسا یک فریم کامل از ویدیو هست که بر خلاف تغییراتی که فقط در فریم‌های P وجود دارد. 

فاصله بین دو آی فریم، بعنوان I-frame interval، گروهی از تصاویر GOV، یا GOP گروهی از تصاویر است. یک مثال، این تصویر نشانگر آی فریم یک صحنه‌ی بیرونی استفاده شده در تست‌های ماهست. 

فریم‌های I

پی فریم

پی فریم به تصویر کامل آی فریم قبلی اشاره می‌کند. تا فقط تغییرات صحنه را ارسال کند. تغییرات ممکن است که کوچک باشند، مانند نویز دیجیتالی یا حرکت شاخ و برگ درختان، مانند دوربین PTZ که از حالت یک پریست به پریست دیگر حرکت می‌کند. حرف P در پی فریم مخفف پیش‌بینی‌کننده است. 

تغییرات در یک پی فریم ارسال شده از صحنه تستی در تصویر زیر قابل مشاهده است. فقط نواحی نزدیک به جاده، جایی که خودروها در حال عبور هستند، و شاخ و برگ به سمت راست حرکت می‌کنند، تغییرات را ارسال می‌کنند. 

پی فریم

با کنار هم قرارد دادن این‎‌ها در فیلم زیر، تغییرات فریم P را می‌توان روی هم انباشته دید، تا زمانی که آی فریم بعدی ارسال شود(15 ثانیه).

انواع فریم‌های فشرده سازی دیگر

نکته قابل تامل این هست که انواع فریم‌های دیگری نیز وجود دارند علاوه بر I و P، مانند B، SI، SP، اگرچه آن‌ها عملا در نظارت تصویری و دوربین مداربسته استفاده نمی‌شوند. برخی از دوربین‌های IP، از بی فریم پشتیبانی می‌کنند، اما همه VMSes ها قادر به دکودینگ نیستند، پس معمولا از آن نیز استفاده نمی‌شود. 

کدک‌های استاندارد

از سال 2022، میزان استفاده h.265 به نسبت h.264 بیشتر شده است. مشکلات بار CPU با بهبود پشتیبانی از رمزگشایی سخت افزار کاهش یافته است. اگرچه H.264 نیاز به سخت افزار کمتری دارد و سبب شده برخی بازهم H.264 را به H.265 ترجیح دهند. 

کدک‌های اختصاصی 

تعداد بسیار کمی از کدک‌های صنعت نظارت تصویری در سال 2022 استفاده می‌شوند. در دیگر سیستم‌های آنالوگ قدیمی، ویدیو انکودشده، ذخیره‌شده و در همان دستگاه مدیریت می‌شود(مانند یک UVR). که استفاده از کدک اختصاصی را آسان‌تر می‌کند. زیرا سازنده کل فرآینده را کنترل می‌کند. به هر حال، انکود دوربین‌های IP، به تنهایی ویدیو را رمزگذاری می‌کند. پس باید این ویدیو رمزگذاری شده را برای ذخیره و مدیریت آن به یک ضبط کننده VMS ارسال کنند. کدک‌های اختصاصی پیچیدگی ذخیره، مدیریت و نمایش تصاویر روی مانیتور صنعتی یا ویدئو وال افزایش می‌دهند. زیرا هر کدام باید با VMS یکپارچه شوند. هزینه‌های بالای انجام کار برای چندین کدک اختصاصی باعث انگیزیه بیشتر کدک‌های سازنده دوربین های IP شده است. 

اسمارت کدک یا فشرده سازی هوشمند

در گذشته، فرمت‌های H.265 و H.264 رایج شده‌اند. با هدف کاهش بیشتر بیت ریت در مقایسه با استاندارد H.264/5 است. نحوه عمکرد این کدک‌های هوشمند دقیقا متفاوت است. در ادامه دو تکنیک استفاده از آن‌ها را بررسی می‌کنیم:

فشرده سازی هوشمند

به جای اعمال سطوح فشرده‌سازی یکسان در کل صحنه، اسمارت کدک‌های داینامیکی برای فعالیت در FOV دوربین‌ها. برای مثال، به تصویر زیر نگاه کنید، فشرده سازی می‌تواند برروی Low تنظیم شود تا بالاترین کیفیت ظاهر شود. اما بک گراند سفید روی high تنظیم می‌شود، زیرا ما نیازی به جزییات روی دیوار سفید رنگ. 

فشرده سازی هوشمند

آی فریم داخلی بصورت داینامیکی

دوما، کدک‌های هوشمند معمولا بصورت آی فریم‌های داینامیکی و بر اساس فعالیت‌ها در صحنه تنظیم می‌کنند. اگر یک صحنه کوچک باشد یا بدون تحرک باشد، دوربین I-frame ها را بصورت 5، 10، 20  ثانیه یا بیشتر ارسال خواهد کرد. اما اگر فعالیتی در صحنه تشخیص داده شود، یک آی فریم سریعا ارسال شده و آی فریم به حالت نرمال باز می‌گردند(برای مثال 1 ثانیه)، آی فریم‌های داخلی تا زمانی که فعالیت وجود داشته باشد. تصویر زیر یک آنالایزر استریم هست که تاثیر آی فریم اینتروال داینامیکی را نشان می‌دهد. 

آی فریم داخلی بصورت داینامیکی

مزایای کدک هوشمند

در تست‌های ما کدک‌های هوشمند، بصورت قابل توجهی بیت‌ریت را کاهش داده‌اند. حدود 15 درصد در حداقل، اما تا 95 درصد در برخی از صحنه‌ها. این کدک‌ها بیشترین تاثیر را روی صحنه‌ها دارند، آی فریم اینتروال‌ها بصورت طولانی‌تر و فشرده‌تر به دلیل عدم فعالیت است. 

کیفیت Mjpeg و H.264

در حالی‌که فرمت H.264 پرکاربردترین فرمت هست، در این سال‎‌ها، بحث کاهش کیفیت در مقایسه با MJPEG و وجود داشته است. 

به هر حال، موارد متعددی هستند که کیفیت را زیر سوال می‌برند:

تنظیمات با بالاترین سطح فشرده‌سازی: اگر سطح فشرده‌سازی روی بالاترین میزان تنظیم شود، افت کیفیت خواهیم داشت. 

پیچیدگی صحنه

در صحنه‌های پیچیده و شلوغ اغلب این مشکلات نمایان می‌شود. در مکان‌های شلوغ مانند تقاطع‌ها و ...

تنظیمات بیت‌ریت ثابت

اگر CBR استفاده شود ولی بیت ریت خیلی کم باشد، ویدیو افت کیفیت خواهد داشت. به هر حال، در بیشتر موارد، حتی در حالت دیفالت، H.264، کیفیتی شبیه به MJPEG دارد. 

کدک‌های مقیاس پذیر 

بیشتر کدک‌ها فقط از یک رزولوشن پشتیبانی می‌کنند. برای مثال، تغییر از استریم 2 مگاپیکسل به 1 مگاپیکسل با استفاده از MJPEG یا  H.264، نیاز به رمزگذاری یک استریم کاملا جدید یا انتقال کدینگ(مانند پردازش مجدد) برای استریم 2MP برای ساخت 1MP دارد. در بیشتر موارد، اگر شما یک کلاینت با پهنای باند کم را ارسال کنید(مانند موبایل)، یا حجم ذخیره‌سازی ویدیوی قدیمی را کاهش دهید. یک کلاس خاصی از کدک‌ها، اسکیلیبل نامیده می‌شوند، این می‌تواند بصورت اتوماتیک انجام شود. بدون نیاز به درخواست یک استریم جدید یا پردازش مجدد یک استریم موجود. 

یک کدک مقایس‌پذیر، بصورت خاص می‌تواند فریم‌ها یا سطوح رزولوشن که آنها خارج از استریم هستند، انتخاب کنند. این سبب می‌شود که فریم‌ها یا رزولوشن‌ها به دفعات زیادی بصورت داینامیکی رزولوشن و فریم در ثانیه را برای کلاینت‌های موبایل از راه دور تنظیم کنند. 

انواع کدک مقایس پذیر

ردیفنوع کدک مقایس پذیر توضیحات
1SVCمقیاس پذیر H.264+  است. جنبه مثبت آن این هست که مقیاس‌پذیری را با مزایای پهنای باند H.264 ترکیب می‌کند. متاسفانه، تولیدکنندگان کمی این را پشتیبانی می‌کنند. اکثر آن‌ها این کار را از طریق چنداستریمی(ارسال چندین استریم بطور همزمان با وضوح و فریم ریت) انجام می‌دهند. 
2JPEG2000که در اصل MJPEG است، با اضافه‌شدن مقیاس‌پذیری. این کدکی هست که اویجیلون بطور سنتی از آن استفاده می‌کرد. اما در دروبین‌های جدید آن را حذف کرده است. نقطه ضعف بزرگ در JPEG2000 مانند MJPEG، افزایش گسترده پهنای باند/ذخیره‌سازی در قیاس با H.264 است. 

SVC بسیار کند توسعه پیدا می‌کند، در برخی از دوربین‌ها(حداقل روی کاغذ) برای چندین سال، با وجود در دسترس بودن، پذیرش واقعی بسیار کم هست. 

با توجه به مزایای نرخ بیت H.264 هوشمند(که نیازی به توسعه VMS جدید ندارند)، و H.265 که اولویت دارند، بعید هست که SVC به یک عامل اصلی در کدک‌های نظارتی تبدیل شوند. 

کدک‌های آینده

در حالیکه کدک‌های جایگزین زیادی مورد بحث قرار می‌گیرند، بسیار بعید هست که هر نوع غیر استانداردی در نظارت مورد پذیرش گسترده قرار گیرد. برای مثال برخی از تولید کنندگان ادعا می‌کنند که از طریق کدک‌های اختصاصی خود، مانند Digital Barriers TVI / EdgeVis صرفه‌جویی زیادی در پهنای باند مصرفی دارند. 

با این حال، این امر به تولیدکنندگان دوربین و توسعه دهندگان VMS نیاز دارد تا این کدک‌ها را در محصولات خود پیاده‌سازی کنند. علاوه بر این، با توجه به کاهش قابل توجه نرخ بیت ریت کدهای هوشمند، که با اکثر ضبط‌کننده‌های فعلی H.264 سازگار هستند، سرمایه‌گذاری در توسعه برای افزدون این کدک‌های اختصاصی بعید هست. 

چه نوع کدکی را انتخاب کنیم؟

در سال 2022، بهترین ترکیب کدک برای بیشتر موارد، استفاده از H.264 با پشتیبانی از کدک هوشمند است، زیرا کدک‌های هوشمند بطور قابل توجهی کارایی H.264 را با حداقل نکات منفی بهبود می‌بخشند. 

H.265 در حال تقویت است، اما در بسیاری از موارد به دلیل محدودیت های مختلف منتفی خواهد بود. اگرچه، بطور قابل توجهی قوی‌تر است، اغلب در سیستم های دوربین/NVR از یک تولیدکننده بصورت end-to-end استفاده می‌شود، جایی که مشکلات سازگاری به حداقل برسد. 

MJPEG برای برنامه‌های تخصصی و کسانی که از فشرده‌سازی هراس دارند، یک نیچ باقی می‌ماند. 

سخن آخر در مورد فشرده سازی تصویر دوربین مداربسته

کمپانی‌های بزرگ تولیدکننده دوربین مداربسته، باید به سمت فشرده سازی تصاویر تولیدی خود بروند. رزولوشن بالا، فضای زیادی از هارد را پر می‌کند. از طرفی در سیستم های نظارت تصویری تحت شبکه IP، پهنای باند مقوله‌ی بسیار مهمی هست. این دو باید توسط فشرده  کردن اطلاعات کنترل شوند. حال هر کمپانی بتواند در این امر موفق عمل کند، طرفداران بیشتری نیز خواهد داشت. 

برای در میان گذاشتن دیدگاه خود لازم است ابتدا وارد حساب کاربری شوید.