مدل پردازش تصویر POCS: تشخیص مرز ویدئو شات (VSBD) یکی از اساسی ترین معیارها برای بسیاری از برنامه های سامانه هوشمند مرتبط با تجزیه و تحلیل فیلم ، از جمله بازیابی ویدئو ، فهرست بندی ، مرور ، دسته بندی و جمع بندی است. در این تکنیک قصد این است که داده های حجیم ویدئو به صورت قطعات معنی دار کوچکتر که ما آنها را عکس می نامیم، کوچک شوند.
در همین راستا مدل پردازش تصویر POCS جدیدی با نام POCS (مدل رنگ-شکل حریف حرمی ) معرفی شده که می تواند انتقال ناگهانی(AT) و انتقال تدریجی(AG) را به صورت همزمان انجام دهد. حتی اگر تغییرات نور داشته باشیم، حرکت اشیاء بزرگ بین فریم ها وجود داشته باشد و یا حرکت سریع دوربین داشته باشیم نیز توانایی تشخیص خواهد داشت. از همین رو مدل پردازش تصویر POCS می تواند نقطه عطفی در VSBDباشد.
با پیشرفت فناوری داده های ویدئوی در تهداد و حجم فایل افزاریش داشتند به همین جهت، تجزیه و تحلیل ویدیوی هوشمند برای سازماندهی و مدیریت این داده های بزرگ ویدیویی اجباری است. اولین مرحله برای پردازش یک ویدئو تجزیه ویدئو در واحدهای اساسی معنی دار است که به عنوان عکس نامیده می شوند. در واقع ویدئو ها مجموعه ای از عکس های پشت هم است که از دید دوربین در یک مکان و زمان مشخص رخ می دهند(پردازش تصویر). بنابراین در هر ویدئو انقال عکس ها به دو صورت انجام می شود.
یا انتقال ناگهانی است و یا تدریجی. انتقال ناگهانی در واقع برش های سخت بین فریم ها است.و انتقال تدریجی زمانی رخ می دهد که ویرایشی مثل محو شدن و پاک شدن اتفاق می افتد. اکثرا کار ها و مطالعات بر روی AT صورت گرفته در حالی که GT چالش بر انگیز تر است. بیشتر روش ها VSBD را با استفاده از ویژگی های سطح پایین مانند رنگ ، بافت ، شکل یا سایر ویژگی های مبتنی بر تبدیل ، همراه با رویکرد مبتنی بر آستانه یا ماشین های بردار پشتیبانی می کنند. فرآیند اصلی تکنیک های تجزیه و تحلیل ویدیو همیشه شامل کارهای سطح بالایی است و چنین برنامه هایی به فرایند VSBD با پیچیدگی کم نیاز دارند.
چنین الزامی به الگوریتم های VSBD برای استخراج فریم های کلیدی باید کاملاً دقیق باشد. از این رو ، الگوریتم های اخیر بر ویژگی های روشنایی غیر متمرکز تمرکز دارند(مدل پردازش تصویر POCS) ، اما آنها در استخراج حیاتی ترین ویژگی در نمونه سازی تنوع محتوا موفق نیستند. با گسترش اثرات تدریجی بر روی محور زمانی ، هر دسته از GT دارای الگوهای زمانی متفاوتی است. مدت زمان گسترش زمانی می تواند از سه تا 100 واحد متغیر باشد. معمولاً این الگوهای زمانی از الگوی حاصل از حرکت دوربین و جسم پیروی می کنند. از این رو ، تشخیص GT به یک مشکل چالش برانگیز در روند VSBD تبدیل می شود
موفقیت هر کار VSBD متکی به نمایش کارآمد محتوای فریم های ویدیویی است. به همین میزان ، پیشنهاد یک توصیف کننده ماهر برای روند VSBD ضروری است. این بخش مقدمات نظری و جزئیات مدل پردازش تصویر POCS را توصیف می کند. مدل رنگ مخالف ، مدل پردازش تصویر POCSبهتری برای بینایی انسان برای بهترین درک رنگ است.
فضای رنگ حریف شامل سه موئلفه است: Opponent Space1 – O1 ، Opponent Space2 – O2 و Opponent Space3 – O3 ، جایی که O1 جز کانال درخشندگی است ، O2 ترکیبی از اجزای کانال قرمز و سبز است و O3 ترکیبی از اجزای آبی و زرد. فضای رنگ حریف Wandell (1995) همچنین می تواند با استفاده از فضای رنگ LMS از نظر ریاضی نشان داده شود. سیستم رنگ LMS به صورت زیر نمایش داده می شود:
و
فضای رنگ حریف همچنین می تواند از طریق sRGB محاسبه شود: