В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик | К списку авторов | К списку публикаций
Статья печатается в авторской редакции
М.В. Руцков
Эксперт, к.т.н.
Приступим к анализу альтернативных вариантов "наладонных" процессоров, в качестве кандидатов для использования в Народном НаноВидеоСервере. Итак, первый претендент - семейство процессоров Nexperia PNX1 700 от компании Philips.
Два года назад на них возлагались большие надежды. В марте 2005 г. был анонсирован процессор ТМ5250, а ещё через полгода -ТМ5270. В общем-то, функциональной разницы между ними не было - никакой! Просто первый предполагалось реализовать по технологическим нормам в 0,13 микрон, а второй - 0,09. Однако ничего у них не получилось - сейчас на сайте компании имеем только ТМ5250(www.nxp.com/acrobat download/literature/9397/75014809.pdf). Таким образом, за два года - ни шага вперёд. Да и "наладонники" на их основе как-то не встречаются. Но наш интерес - проанализировать мощность процессора в плане обработки. Вот основные характеристики чипа в сравнении с Pentium 4 (см. таблицу)
Вы, конечно, спросите - а причём тут Pentium 4? Объясняю, нам надо сделать грубую прикидку - потянет ли ТМ5250 один канал по видедетекции иль нет. Причём этот анализ будет проведён исключительно для наших алгоритмов -мы ведь не знаем, как работают другие системы, хотя слегка и догадываемся. Отправной точкой можно считать тесты нашего 8-ствольного Вдеопроцессора MegaFrame-X(www.mpixel.ru/public/mf-x.pdf). Таких в системный блок было установлено 2 штуки - 16 каналов реального времени. И выяснилось, что для данной конфигурации машины - это почти предел. А теперь сравним процессоры (приведённые в таблице) по скорости обработки. Напомню - наши алгоритмы ориентированы на SIMD-технологии. Расшифровывается как - Single Instruction Multiple Date. Этакий "тупой" параллелелизм -класс! В процессорах Intel - это ММХ и разнообразные SSE штуковины. При таком подходе скорость обработки прямо пропорциональна частоте процессора и числу одновременно обрабатываемых операндов (байтовых) - типа "ширины". Смотрим в таблицу - частота у Pentium в 6 раз больше, а ширина - аж в 4 круче. Уже получаем выигрыш в 24 раза. Но нельзя ещё забывать про размер L2 cache - 128К против 1М. Вот и получается - не тянет ТМ5250 даже полканала. Но ещё раз повторю - всё измерено в наших "попугаях". Может быть, у кого-нибудь алгоритмы быстрее работают - типа межкадровой разницы, но тогда и видеодетекторы будут ещё те! А мы всё-таки пытаемся полосовую фильтрацию реализовать и другие прибамбасы. Это просчёт по скорости, по мощности потребления тоже не ахти - 2.5 ватта
А как с перспективами? Да никак! Два года ничего нового, но, кроме того, непонятно куда дальше грести - у Philips нет процессорных решений, в частности, для персональных компьютеров. В отличие от них, Intel/Marvell будут тащить все свои наработки на мобильные платформы. О совместимости уж и не говорю - всю оптимизацию с нуля начинать надо!
А теперь займёмся компанией Texas Instruments, которая бросила смелый вызов экспансии архитектуры XScale от Intel. Но сначала хотелось бы сказать "пару ласковых" этому гиганту американской индустрии, в котором бюрократия доведена до абсурда. Мы целый год потеряли в бесконечной с ними переписке, пытаясь выяснить простой технический вопрос. Суть сводилась к следующему. Для нашего 8-ствольного ВидеоПрцессора MegaFrame-X мы выбрали чип видеодекодера TVP5040. Причём исключительно благодаря тому, что в нём был прописан параллельный интерфейс для закачки управления в регистры. Всё-таки у нас на плате их 8 стоит. Начинаем отлаживаться - интерфейс не работает! Мы им письмо - они нас в штаты, пишем туда - они в Европу. Но мы ведь русские люди - припёрли к стенке. Тогда они нам и говорят, мол, используйте последовательный интерфейс. Ну, сами понимаете - пришлось обматерить, по-английски естественно. Кончилось дело тем, что они сознались в содеянном, а вернее наоборот, тут же сняли всю документацию с сайта и предложили заменить всю купленную партию чипов на - что пожелаем. Ну, тогда мы пожелали TVP5145 - и, слава богу, всё заработало, хотя год улетел! Нам даже доброжелатели предлагали с ними судиться. Но мы слегка мозгами пораскинули и решили, что получится типа - "Бодался телёнок с дубом"! Вот такой штрих к портрету.
Итак, есть у них такое направление - DaVinci™ Digital Media Processors. Глянешь в такую "простыню" чипов и характеристик к ним - глаза разбегаются, аж 25 позиций, полученных методом комбинаторики из разных ядер, ускорителей и других довесков. А вот самого интересного параметра - потребляемая мощность, и нет! Нет его и в PDF-ax. Как это понимать? А всё просто, когда сие является великим достижением, то выскакивает сразу. Например, видеодекодер TVP51 50 с ультрамалым потреблением - 115 мВт в самом первом абзаце ТО. Делать нечего, пришлось идти другим путём - залезть в Интернет, да поискать. И вот что нашёл.
Про потребляемую мощность ни гу-гу, хотя ясно, что для компактных мобильных устройств это не более одного ватта - не заряжать же аккумуляторы каждые 10 минут. Полез в "простыню" и вижу, что частота процессора чуть больше 500 МГц, a L2 cache - всего 64 Кбайт. Облом!!! Потом нашёл ещё один интересный экземпляр (www.russianelectronics.ru/php/print.php?doc=2621&PHPSESSID=ca4ol8qsc9iap0ri9fc4d7en54).
TMS320DM355 потребляет 400 мВт при декодировании HD MPEG-4. Это вдвое меньше, чем у современных приборов с аналогичными характеристиками. Потребление в дежурном режиме не превышает 1 мВт.
Ага, когда получилось малое энергопотребление, то отрапортовать можно. А что ж там в "простыне". Да ничего хорошего - частота процессора всего 270 МГц, a L2 cache и вовсе отсутствует! Невольно глянул в самое начало "простыни" и аж заколдобился - красавец TMS320DM648. Частота 900 МГц, L2 cache 51 2 Кбайт, PCI 32 бит/ 66 МГц... Стоп, какая такая PCI? Нам она и даром не нужна. И действительно, чип-то для DVR-ов и плат с аппаратной компрессией предназначен. А таковые в основном произрастают на юго-востоке, причём многие используют более ранние Da-Vinci-чипы, на которых стоят... хе-хе - радиаторы! Ну и последняя находка.
Флагманский процессор ОМАР3430 является первым в отрасли продуктом такого класса, поддерживающим спецификацию OpenGL ES 2.0 и OpenVG, что позволит реализовать поддержку "продвинутых" 3D-игр. Также представлены менее мощные, но более дешевые модели ОМАР 3420 и 3410. Все представители процессоров третьего поколения включают ядро ARM Cortex-А8 и производятся по 65-нм нормам. Отмечается, что производительность ARM Cortex-A8 в 3 раза превышает отот показатель широко распространенного сейчас ядра ARM11.
Ну, наконец-то компания свои ядра повыбрасывала и перешла полностью на Cortex-A8 от ARM. Правда добавила кучу своих акселераторов и других кусков типа Image Signal Processor. Конечно Cortex-A8 штука вроде неплохая, но производительность в 2000 DMIPS как-то не очень впечатляет.
Итак, что же можно сказать о гиганте американской индустрии. Да особо ничего - какая-то "разлапистость" наблюдается или стремление объять необъятное. Совершенно непонятно, что будет в перспективе - эксперименты по сращиванию ядер идут на ходу. И естественно, как и у Philips - нет багажа наработок по серверным и настольным процессорам. Правда у последней - "и труба пониже, и дым пожиже". Вопрос совместимости с платформой х86 тоже не решён Математикам с программистами надо всё начинать практически с нуля - тяжёлый случай. Да и средства проектирования требуют серьёзных вложений - не всякая компания потянет такие затраты.Ладно, а как поживает вечный конкурент Intel -AMD? С совместимостью у них вроде всё должно было бы более-менее получиться. Ан нет -компания пошла своим историческим путём и родила семейство Alchemy для мобильных устройств. Причём процессоры были реализованы на базе архитектуры MIPS32, которая не имеет ничего общего с х86. В конце концов, компании AMD это разонравилось и со словами "не получилось", она запродала всё это хозяйство фирме RMI летом 2006 г. Посмотрим, как у них обстоят дела на данный момент - вот в частности.
По сравнению с предшественником, частота Аи 1250 повышена до 600 МГц, а энергопотребление снижено на 30% (в активном режиме) и на 60% (в режиме энергосбережения). Как утверждает разработчик, новый процессор является лидером отрасли по удельной производительности в расчете на единицу потребляемой мощности.
И действительно - из ТО следует, что энергопотребление на частоте 600 МГц составляет 0,5 ватта. Однако на этом все прелести и заканчиваются -архитектура 32 бита против 64 бит Wireless ММХот Intel/Marvell. А если глянуть в блок-схему, то L2 cache днём с огнём не найти.
Ну и для полного счастья нельзя не упомянуть такого монстра рынка КПК и смартфонов, как Samsung. Вот штрих к портрету.
В общем, правая рука не знает, что делает левая. Короче ожидать какого-либо прогресса в архитектурном плане не приходится. Может быть, лень - типа и так покупают. Сами посмотрите на блок-схему - L2 cache не наблюдается. Совместимостью тоже не пахнет.
Вот, собственно говоря, и всё. Выводы делайте сами. От себя лишь добавлю - серьёзным конкурентом Intel/Marvell можно считать лишь Texas Instruments. Да и то, если за системный ум возьмётся. Хотя пардон, мне ли делать со своего пригорка замечания колоссам - куда развиваться. Они решают свои задачи - мы для них со своим охранным видеонаблюдением лишь песчинка в огромном океане мультимедиа технологий! Эх, хотел ведь концептуальные выводы сделать-типа, зачем ажтри статьи про Народный НаноВидеоСервер накатал. В чём смысл? Отвечу словами товарища Саахова: "Э-э, нет, торопиться не надо, торопиться не надо!". В следующем номере - обязательно!
Опубликовано: Журнал "Системы безопасности" #6, 2007
Посещений: 9047
В рубрику "Видеонаблюдение (CCTV)" | К списку рубрик | К списку авторов | К списку публикаций