Photosynth - это веб-7.0 какой-то…

* Опубликовано в категориях Microsoft: продукты и сервисы

PhotosynthЯ, признаться, со всей этой суетой пропустил один действительно инновационный, а где-то и поражающий воображение продукт/технологию, готовящийся к выходу в Microsoft Live Labs. Этот продукт - Photosynth. Вообще конечно это нужно видеть, а не читать, там, к счастью, есть демо-видео, а также пошаговое описание того, как и почему оно работает. Для тех, кто не хочет один раз увидеть, сделаю “один раз услышать” :) –

Суть технологии заключается в том, что берутся все возможные фотографии мира, анализируются, и затем сопоставляются похожие и на основе всех этих данных строится полная и трехмерная модель.. мира. По-крайней мере, той его части, которая была когда-либо сфотографирована. То есть, вы можете посмотреть на Лувр со всех сторон. Увеличить любой его участок - потому что он сфотографирован с любым возможным зумом тысячи раз, а сопоставление уже сделано. И т.п.  И все это - автоматически. Никаких тегов и человеческого вмешательства.

Я, честно скажу, был поражен. Ведь действительно - вся информация есть давно. Взять хоть Фликер - фоток какой-нибудь Пизанской башни там сто тысяч со всех возможных углов, то же самое относится ко всем остальным сколько-нибудь посещаемым местам. Но вот технологии собрать это все воедино и сделать удобным для использования - не было. Теперь есть.

В общем, рекомендую один раз увидеть. А одно очень интересное использование этого сервиса / технологии может быть таким: любая фотография теперь - это окно в трехмерный мир. Сфотографируйте телефоном Кремль, загрузите фотографию в Photosynth - и можете делать из нее zoomin/out, ходить влево-вправо и назад, искать похожее… Не разглядели, что это за объект в углу фотографии из отпуска? Нет проблем, войдите через нее в мир Photosynth, и все загадки разрешатся. В общем, дух захватывает от перспектив. Скорее бы что-то показали для публики :)

Комментариев: 29

  1. October 19th, 2006 | 9:03 pm

    Мечтатели… красиво как рассказывают… вот только… может сначала МС научится делать outlook который не занимает 100% процессорного времени если связь плохая с сервером IMAP? А тогда покажите, что умеет в области ИИ. А то Скрепка была очень неубедительная (((

  2. October 19th, 2006 | 9:24 pm
  3. October 19th, 2006 | 9:57 pm

    Да ладно, Миш, ты мне прям zdnet сейчас напомнил :)

    Уж в Live-то до сих пор все без исключения продукты и сервисы были клевыми. А Labs - так и вовсе.

  4. October 19th, 2006 | 10:18 pm

    Антон, ну а что делать если это пип-пип приложение реально хреново работает и достало уже сегодня? Ты же не будешь утверждать что 100% загрузка процессора в случае когда данные медленно передаются по сети это есть хорошо написанное приложение? И факт что аутлук так себя ведет не будешь отрицать? Могу показать и воспроизвести на любом компьютере. 2007 аутлук немного лучше, но все равно очень сильно загружает процессор так что аж мышь зависает.
    Вывод достаточно простой - как минимум некоторые продукты МС имеют серьезные проблемы.
    Я не главный специалист по ИИ и фото, но много играюсь с этим софтом, хотя бы HDR images и сшивание панорам. Не умеет софт сегодня оченивать правильно фотографии. Не понимает разную освещенность на разных снимках, ему нужны данные из EXIF о типе линз, фокусном растоянии итд итп. Артефактов полно и без движущихся предметов, а с ними это уже просто вилы.
    Если посмотреть презентацию, то видно, что это … ну грубя говоря фальшивка, а мягко говоря маркетинговый материал. На разных фотографиях люди находятся в одних и тех же местах. Часы, как считают разработчики, всегда будут показывать одно и то же время, тени будут падать одинаково…

    Так вот мне интересно, может быть MS Lab все-таки доделает те продукты, которые MS выпускает уже десятилетие, вместо таких проектов?

    Извини, но при все хорошем отношении к MS и тебе лично, но диагноз этого проекта - ЛАЖА 2.0

  5. October 19th, 2006 | 10:23 pm

    Миша, при чем здесь аутлук мне совершенно непонятно. Что касается Фотосинтеза, то технология была представлена на SIGGRAPH и разрабатывалась в сотрудничестве с одним из университетов (на сайте написано, с каким). Будь это, как ты говоришь, фальшивка, это бы десять раз уже обсудили везде, начиная от Слешдота и заканчивая академическими изданиями. R&D в Майкрософте, в частности, по распознаванию изображений и звука, очень сильный - я знаю о чем говорю.
    А вот как ты ставишь диагнозы на основании просмотра видео-демки, у меня вызывает удивление. Как-то это не очень аналитично, не находишь? :)

  6. October 19th, 2006 | 10:42 pm

    Антон, даже кошке позволено смотреть на королеву.
    Тезиса ровно два:
    - текущие продукты МС имеют ряд … особенностей… которые переходят из продукта в продукт и не лечатся
    - изображенный на видеоролике процесс подтасован

    По первому тезису есть сомнения?
    По второму тезису. Еще раз:
    1. Использованые фотографии сделаны профессиональным фотографом в одном месте в одно время
    2. Реальные условия снимков будут отличаться как небо и земля.
    3. Распознование образов сегодня не выдерживает никакой критики. Ни у МС ни у кого другого.
    4. Технология построения 3D модели по снимкам и натягивания на нее снимка известа черт знает сколько лет. Я еще в 96 году игрался с таким софтом. Только там вручную надо было грани и углы указывать. Я верю, что можно написать софт, который это будет делать хоть как-то приемлимо, но … в условиях идеальных - см. пп. 1-2
    5. Антон, у меня научное прошлое и вполне, поверь, серьезно начинавшиеся. Фраза “представлена на SIGGRAPH” не является доказательством чего бы то ни было. Более того, она точно копирует СПАМ “Это было по CNN” или “Как было на шоу Опры Хазы”…
    6. Я добавлю еще один маленький штрих касательно “R&D в Майкрософте, в частности, по распознаванию изображений и звука, очень сильный - я знаю о чем говорю”.
    Успехи МС в области распознования изображений и звуку у меня есть на планшетнике. Могу тебе сказать, что всех усилий МС на этом поприще не хватило, чтобы сделать хоть минимально реально работающее распознование перьевого ввода и диктовки. Покажи, мне плиз, кто использует эти технологии в реальной жизни.
    7. И последнее. Даже когда распознаются все архитектруные скилеты, точки итп. То это не решает пробелему разного освещения, времени съемки и движущихся предметов.

    Итого, что у МС хорошо, то хорошо. Что МС делать не умеет, то не умеет. Может быть научится, но … не скоро…
    А сейчас МС просто играет в перегонки с Гуглом - кто выложит в сеть больше социальных сервисов….

  7. October 19th, 2006 | 10:52 pm

    Миша:
    1-2: возможно.
    3: где ты видел последнюю технологию распознавания образов MS? Я - только демки Research Labs на внутренних евентах. Они - очень впечатляют, хоть и небезупречны (напр., на просьбу найти лица нашлась фотография бабочки крупным планом ввиду занятного рисунка на крыльях).
    5: возможно, не буду спорить.
    6: processing power планшетника и датацентра, на котором может быть запущен веб-сервис, сильно разные, не находишь? а все проблемы с этими алгоритмами во многом упираются в тупую производительность железа.
    7: да, проблема есть. Как решена и решена ли - интересно будет посмотреть.

    Во внутренних дискуссиях ребята из Live Labs были очень убедительны. В любом случае, я надеюсь, скоро мы со всем этим сможем поиграться сами и получить аргументированное и основанное на собственном опыте представление :)

  8. October 19th, 2006 | 11:05 pm

    Была такая контора - Esqalibur. Ее потом Informix кажись купил, а сейчас значит в IBM. У нас ее еще Метатехнология занималась.
    Вот эта контора всем рассказывала как она замечательно умеет делать нечеткий поиск и показывала как даже не знаю как правильно пишется Мао Цзедун, она в базе документов его находит. Правда с Дэн Сяо Пином уже работало хуже…
    Примеры, которые показывают на демонстрациях подобраны так, чтобы они всегда были очень красивы и показательны. В реальной жизни единичные технологии показывают что-то приличное…

    Так что что они там показывают на этом ролики и что на внутренних эвентах…

    Теперь по мелочам. “processing power планшетника и датацентра, на котором может быть запущен веб-сервис, сильно разные, не находишь? а все проблемы с этими алгоритмами во многом упираются в тупую производительность железа”.
    Алгоритм либо есть, либо его нет. Если его не могут продемонстрировать на планшетнике, то рассказы о том, что на сервере он есть, напоминает истории о чудо-оружии третьего рейха. Покажите и дайте попробовать. Покажите, что если у меня есть 512 процессоров, то я могу наконец распознать голос и диктовать мои документы.
    Но ведь нет такого демо!

    Ну и последние. МС очень серьезная компания и ее сотрудники мастера демонстраций. Будет продукт, будем обсуждать.

    А пока может хоть кто-нибудь возмется и исправит этот идиотизм в outlook?

  9. October 19th, 2006 | 11:14 pm

    Слушай, хочешь, я тебе карточку Quick Assist дам? Там вроде вменяемая техподдержка может инцидент отработать. А то я imap не пользую, так что даже не совсем понимаю, о чем речь идет. Да и вообще, мы уже все на 2007 офисе давно :)

  10. October 19th, 2006 | 11:17 pm

    У меня на планшетнике (Центрино 1.5МГц) 2007 офис, бета 2TR - ваш последний релиз. Проблема осталась. Подвисает система на момент синхронизации. Причем поток по сети может быть 200 байт, а на 10 минут процессор загружен на 100% (в 2003 офисе).
    Я не думаю, что саппорт ваш поможет. Это в нем внутри…

    По практике распознавания добавлю чуток.
    Эскалибур полность валился когда нужно было делать реальный поиск. Оказывалось, что для нечеткого поиска нужно было делать некий допуск, но как только допуск становился хоть немного способным поймать нужные документы он немедленно становился дырой для кучи ненужных документов и прочего шума. Не работало.

  11. D.Shakirov
    October 20th, 2006 | 8:44 am

    Больше пяти лет работаю с Outlook. Из недостатков:
    - при включенной опции “Использовать Word 2003 как редактор сообщений” и недоступности принтеров возникает сильная задержка при создании письма.

    Ни разу не видел чтобы Outlook загружал процессор до 100% при недоступности почтового сервера, хотя случаи такие в работе были. Может быть у Вас кривизна где-нибудь в другом месте?

  12. October 20th, 2006 | 8:57 am

    Не при недоступности. При недоступности все нормально. Опишу точнее:
    - Соединение с сервером IMAP4
    - Начинается сессия синхронизации Inbox и папок
    - Начинается успешно
    - В этот момент не приходит ответ от сервера почты
    - Аутлук загружает процессор на 100% до появления связи
    - Если связь не восстанавливается, то это продолжаетс минут 5 пока не отваливается по таймауту

    Воспроизведено на 4 машинах.

  13. October 20th, 2006 | 8:59 am

    да ну нафиг аутлук тут обсуждать
    есть масса других интересных продуктов

  14. Denis
    October 20th, 2006 | 9:28 am

    поддержу Михаила - есть такая проблема….

  15. October 20th, 2006 | 11:43 am

    Предлагаю почтовых клиентов и их баги обсудить на форуме открытого специально для этого: http://www.aboutmail.ru/forum/

  16. October 20th, 2006 | 1:08 pm

    А уж как Ворд работает. Аутлук хоть там может сложный софт какой сетевой,но уж буковки сохранять на диск если не можем - о каком там Веб7.0 речь

  17. October 20th, 2006 | 1:16 pm

    Валь, ну ладно уж. Не бейте МС - остальные не лучше. Ну разве что ТеХ хорошо сделан ))

    Но вот в фотопроекте я не думаю, что это дойдет до реального применения. Слишком сложно для массовой технологии…

  18. October 20th, 2006 | 9:09 pm

    Ну, саму-то технологию представить было нетрудно уже давно. А вот что трудней представить - так это какую замечательную волну фото-спама породит такой сервис, когда станет массовым. Вот один из вариантов:
    http://webplanet.ru/column/gadgets/l_e_x_a/2006/10/03/blindcamera.html

  19. October 20th, 2006 | 10:47 pm

    Впечатляющая технология, но вот где её использовать на самом деле трудно представить - какое кому дело до детальки справа внизу от Кремля?

  20. October 25th, 2006 | 9:09 am

    Обновленный список блоггеров…

    Добрый день! Хотелось бы вспомнить героев поименно. Приятно, что их списки продолжают шириться :) Акмарал…

  21. November 1st, 2006 | 2:37 am

    […]

  22. November 1st, 2006 | 10:30 pm

    Mikhail Elashkin: Глючит Outlook? обратись в саппорт. Outlook пиратский? Купи его, а затем обратись в саппорт. Они за это деньги получают, пусть свою зарплату отрабатывают. А тут, мне кажется, абсолютно никому не интересно - что у тебя и как глючит.

    Господа, вы еще предложите взаимосвязь наподобие: Photosynth кака, потому, что жена изменяет или дочь проститутка )))

  23. November 1st, 2006 | 11:05 pm

    2 Сергей Кострюков (Whistler)
    Мальчик, не хами!

  24. Vladislav Artukov
    November 2nd, 2006 | 8:46 am

    Это как с “десятками” - их все еще выпускают, их все еще покупают. Но ведь все знают, что “десятка” - откровенно нестабильный Инструмент для перемещения биомассы из точки А в точку Б.

    Михаил Елашкин просто озвучил одну из важных проблем, которые присущи Инструментам от Microsoft. Они нестабильны. Или стабильны, но с таким количеством подпорок, что просто волосы дыбом. Не получается эффективная работа, если Инструмент нестабилен. Outlook - всего лишь пример такого Инструмента. И хуже всего, что тренд какой-то вялый, нейтральный.

  25. November 3rd, 2006 | 5:11 am

    Рекомендую посмотреть наработки Carnegie Mellon University по этой теме. Впечатляет.

    http://www.youtube.com/watch?v=VuoljANz4EA&NR

  26. User73137
    November 5th, 2006 | 1:01 am

    Михаил Елашкин, не вы ли в холиварах на ZDNET всегда занимали промайкрософтовскую позицию? Ну, понятно, если человек работает в/для M$, он будет ее хвалить… но жаловаться при этом на загрузку аутлука? Поставьте себе Бат плюс отдельные проги для контактов, календаря и т.д. Маздай - он и есть маздай.

  27. November 5th, 2006 | 9:30 am

    2 User73137
    Странные все-таки люди бывают… Для них весь мир поделен - это белое, это черное; эти за красных, эти за белых… А препдоложить, что есть люди, которые выступают за разум у них как-то не получается…

    Если взять zdnet, то это не про-МС политика, а выражение моего отношения к маловменяемым сторонникам OSS и воровства софта как права каждого “честного юзера”. Если вы считаете, что это МС политика, то …
    Но это никоим образом не означает, что если я в чем-то совпадаю с этой компанией, то я буду закрывать глаза на все…

    Что касается Бата и прочего - для меня это не решение. Я уже не говорю, что мне нужно интегрированное решение, с приглашениями на встречи отправляемыми из календаря участникам итп итд
    Если бы вы потратили время и посмотрели на то, чем на самом деле отличаются офисные продукты МС от других, то обнаружили бы, что серверной частью. У меня аутлук завязан как клиент на SharePoint и MS CRM. Одиночные продукты могут быть лучше в своем классе или в какой-то одной функции, но МС дает возможность построить интегрированное решение не прикладывая много усилий.

    А т.к. я легальный пользователь продуктов МС (Whistler ку-ку), то техподдрежку спрашивал. Предложение купить более мощный компьютер я не рассматриваю как решение…

  28. November 6th, 2006 | 5:19 pm

    Ку Ку :))))))

  29. November 8th, 2006 | 1:13 am

    […] Оказывается Microsoft Live Labs занимается следующими проектами: “берутся все возможные фотографии мира, анализируются, и затем сопоставляются похожие и на основе всех этих данных строится полная и трехмерная модель.. мира. По-крайней мере, той его части, которая была когда-либо сфотографирована.” Читаем статью “Photosynth - это веб-7.0 какой-то…” […]



Комментировать

Подписаться на комментарии к записи по RSS