Microsoft представляет Magentic-UI: инструмент ИИ, разработанный для управления сложными веб-задачами.
Microsoft запускает Magentic-UI: продвинутый веб-агент для сложных задач
Microsoft официально представила Magentic-UI, современный веб-агент, разработанный для помощи пользователям в навигации по сложным онлайн-задачам. Этот инновационный инструмент, разработанный Microsoft Research, является открытым прототипом, который акцентирует внимание на взаимодействии с ИИ, ориентированном на человека, обеспечивая поддержку в реальном времени через веб-браузеры.
Ключевые особенности Magentic-UI
Magentic-UI построен на основе предыдущей многопользовательской системы Magentic-One и фреймворка AutoGen. Он придает приоритет прозрачности, управляемости и сотрудничеству человека с ИИ, предоставляя надежную платформу для пользователей и исследователей для изучения взаимодействий с ИИ и механизмов надзора.
В отличие от традиционных инструментов ИИ, которые работают автономно, Magentic-UI ставит пользователей на передний план выполнения задач. Он позволяет пользователям напрямую изменять планы выполнения ИИ через редактор планов или текстовые отзывы, обеспечивая ясность на каждом этапе перед началом задачи. Этот механизм совместного планирования улучшает понимание пользователями намерений ИИ, уменьшая неопределенности, часто связанные с операциями "черного ящика" ИИ.
Повышенная безопасность и гибкость
Magentic-UI включает защитные механизмы действий, требующие явного одобрения пользователя для чувствительных операций. Пользователи могут настраивать частоту этих одобрений, обеспечивая как безопасность, так и гибкость. Система использует технологию Docker для изоляции своей операционной среды, предотвращая непреднамеренные воздействия на хост-систему. Кроме того, механизм белого списка сайтов ограничивает доступ ИИ, что дополнительно усиливает меры безопасности. По данным Microsoft, Magentic-UI успешно прошел оценки красной команды, продемонстрировав устойчивость к атакам межсайтового скриптинга и фишинга.
Многопользовательская архитектура для эффективного управления задачами
В центре Magentic-UI находится его многопользовательская архитектура, основанная на системе Magentic-One и фреймворке AutoGen. Система состоит из четырех специализированных агентов, каждый из которых отвечает за определенные задачи:
- Оркестратор: ведущий агент, который управляет планированием задач, их декомпозицией и координацией, динамически корректируя стратегии выполнения.
- WebSurfer: сосредоточен на веб-навигации и операциях, способен искать информацию, заполнять формы и взаимодействовать с онлайн-элементами.
- Coder: облегчает генерацию и выполнение кода, идеально подходит для задач, требующих программной поддержки, таких как анализ данных или автоматизация сценариев.
- FileSurfer: управляет файловыми операциями, просматривает локальные директории, анализирует содержимое файлов и поддерживает различные типы документов.
Эти агенты сотрудничают через внутреннюю и внешнюю обратную связь, обеспечивая эффективное выполнение сложных рабочих процессов. Например, Magentic-UI может автоматизировать заполнение веб-форм, проводить глубокую навигацию по сайтам (например, фильтровать информацию о рейсах) или генерировать аналитические графики из веб-данных, значительно повышая продуктивность.
Открытый исходный код и вовлечение сообщества
Magentic-UI доступен под лицензией MIT и может быть доступен на GitHub (Репозиторий Magentic-UI на GitHub). Он также интегрирован в Azure AI Foundry Labs, предоставляя разработчикам, бизнесу и исследователям платформу для экспериментов и инноваций. Пользователи могут взаимодействовать с Magentic-UI через текстовые вводы и вложения изображений, позволяя системе генерировать планы на естественном языке с возможностями редактирования в реальном времени.
Кроме того, Magentic-UI обладает возможностями обучения планам, позволяя ему учиться на исторических задачах и оптимизировать эффективность будущей автоматизации. Microsoft подчеркивает, что дизайн Magentic-UI следует подходу, ориентированному на человека, который постоянно уточняется на основе отзывов пилотных пользователей для обеспечения интуитивного и эффективного пользовательского опыта.
Заключение
Magentic-UI представляет собой значительный шаг вперед в области инструментов ИИ, способствуя сотрудничеству человека и ИИ и повышая эффективность сложных веб-задач. Эта инициатива с открытым исходным кодом не только способствует исследованиям в области взаимодействия человека и машины, но и предоставляет разработчикам модульную и масштабируемую платформу для создания более умных приложений ИИ.
Для получения дополнительных сведений о последних разработках в области ИИ следите за нашими ежедневными обновлениями на AINavHub. Изучите развивающийся ландшафт искусственного интеллекта и откройте для себя инновационные приложения, которые могут трансформировать ваш рабочий процесс.
. Для получения дополнительной информации посетите AINavHub.
Откройте для себя широкий спектр инновационных решений, адаптированных к вашим потребностям. Узнайте больше и исследуйте инструменты ИИ, созданные для пользователей, в нашем Каталоге инструментов ИИ, где вы можете изучить такие функции, как умный поиск и ИИ-ассистенты, чтобы найти идеальный инструмент для вас.







