Публичные новости

Кризис достоверности в искусственном интеллекте: OpenAI показала, что LLM выдают ложные ответы в 60% случаев

Автор: ixbt Дата: 03.11.2024 23:51

8 0 0

Компания OpenAI представила новый бенчмарк под названием SimpleQA для оценки точности выходных данных собственных и конкурирующих моделей ИИ. Однако результаты тестирования выявили серьёзные проблемы с достоверностью информации, генерируемой современными крупными языковыми моделями (LLM).

Цель нового бенчмарка — обеспечить объективную оценку точности и надёжности LLM, которые всё чаще используются в различных сферах жизни, от образования и разработки программного обеспечения до здравоохранения и правоохранительных органов. Однако, как показало тестирование, даже самые передовые модели, такие как o1 от OpenAI и Claude-3.5-sonnet от Anthropic, демонстрируют крайне низкие показатели успешности - 42,7% и 28,9% соответственно.

Источник: Michael Dwyer / AP

Проблема усугубляется тем, что модели склонны «переоценивать свои возможности» и выдавать ответы, которые являются полной ерундой, известной как «галлюцинации». Эта тенденция хорошо документирована и может привести к серьёзным последствиям, особенно в таких чувствительных областях, как здравоохранение и правоохранительная деятельность. Например, модель ИИ, используемая в больницах и построенная на технологии OpenAI, была замечена в частых галлюцинациях и неточностях при расшифровке взаимодействий с пациентами. Полицейские в США также начинают использовать ИИ, что может привести к ложным обвинениям невиновных или усилению предубеждений.

По словам экспертов, результаты тестирования на бенчмарке SimpleQA являются тревожным сигналом о том, что нынешние LLM крайне неспособны достоверно говорить правду. «Это событие должно послужить напоминанием о том, что к любому результату работы любого LLM следует относиться с изрядной долей скептицизма и быть готовым тщательно проверять сгенерированный текст», — заявил представитель OpenAI.

Остаётся открытым вопрос, можно ли решить проблему достоверности LLM с помощью ещё больших обучающих наборов, как утверждают лидеры в области ИИ. Однако, по мнению некоторых экспертов, необходимо искать новые подходы к разработке моделей ИИ, которые бы обеспечивали более высокую точность и надёжность генерируемой информации. «Мы должны сосредоточиться на разработке моделей, которые могут не только генерировать правдоподобные ответы, но и оценивать их и отказываться от ответа, когда не уверены в достоверности», — отметил один из исследователей в области ИИ.

Результаты тестирования на бенчмарке SimpleQA подчёркивают необходимость дальнейших исследований и разработок в области искусственного интеллекта, чтобы обеспечить надёжность и достоверность генерируемой информации и предотвратить потенциальные негативные последствия использования LLM в различных сферах жизни.

Прочитать...

Джефф Безос снова продаёт акции Amazon на $3 млрд

Автор: ixbt Дата: 03.11.2024 23:51

2 0 0

Основатель Amazon Джефф Безос продолжает продавать акции своей компании, на этот раз на сумму более $3 миллиардов, согласно последнему нормативному документу, опубликованному в пятницу. Эта продажа более 16 миллионов акций произошла, когда акции Amazon снова приблизились к отметке $200 за акцию, что является самой высокой ценой с момента листинга компании на NASDAQ в 1997 году.

Безос уже продал акции Amazon на сумму более $13 миллиардов долларов в 2024 году. Эти продажи акций были использованы для финансирования различных проектов и инициатив, включая его космическое предприятие Blue Origin и фонд Bezos Day One Fund стоимостью $2 млрд, который фокусируется на бездомных семьях и дошкольном образовании.

Последняя продажа акций произошла после того, как Amazon превзошла ожидания по прибыли за третий квартал, что привело к росту акций на 7% на торгах в пятницу. Акции Amazon выросли более чем на 40% за последние 12 месяцев, что помогло увеличить чистый капитал Безоса до $222 миллиардов, согласно индексу миллиардеров Bloomberg.

Источник: Bezos Earth Fund

Безос остаётся председателем совета директоров Amazon, хотя его внимание переключилось на Blue Origin. На прошлой неделе он оказался в заголовках новостей из-за своего решения положить конец традиции The Washington Post поддерживать кандидатов на пост президента. Безос, которому принадлежит газета, подвергся резкой критике после заявления, сделанного всего за 11 дней до выборов.

В колонке в The Washington Post, опубликованной в понедельник вечером, Безос заявил, что хотел бы, чтобы решение не поддерживать ни одного кандидата было принято раньше, чем «за мгновение до выборов и эмоций, которые они вызвали».

В ноябре 2023 года Безос объявил, что покидает свой родной город Сиэтл, где базируется Amazon, и переезжает в Майами. Переезд вызвал вопросы о налоге на прирост капитала в штате Вашингтон, принятом в 2021 году, который налагает 7% налог на любой прирост капитала свыше $262 000 от продажи акций и облигаций. Во Флориде нет налога на прирост капитала. Безос отметил, что хочет быть ближе к своим родителям и операциям Blue Origin во Флориде и не упомянул налоги.

До этого года последняя продажа акций Amazon Безосом была в 2021 году. Цикл продажи акций, вероятно, будет продолжен, поскольку Безос продолжает финансировать свои амбициозные проекты и инициативы.

Прочитать...

ESA и Институт SETI готовят человечество к контакту с внеземными цивилизациями: командой отца и дочери расшифрован первый сигнал

Автор: ixbt Дата: 03.11.2024 22:50

3 0 0

В 2023 году Европейское космическое агентство (ESA) и Институт SETI провели эксперимент под названием «Знак в космосе» (A Sign in Space), целью которого было проверить методы декодирования потенциальных сигналов от внеземных цивилизаций. В рамках этого проекта марсианский зонд ExoMars Trace Gas Orbiter передал на Землю закодированное сообщение, смоделированное как возможный инопланетный сигнал.

Спустя год, в 2024 году, команда отца и дочери, Кен и Кели Чаффин, успешно расшифровала этот сигнал. Они использовали свою интуицию и провели многочисленные симуляции, чтобы извлечь информацию из необработанных данных радиосигнала. Прежде чем команда смогла расшифровать сообщение, группа из примерно 5000 гражданских учёных извлекла сигнал из сырых данных всего за 10 дней.

Аминокислоты, переданные в радиосигнале, отправленном на Землю в 2023 году орбитальным аппаратом ExoMars Trace Gas Orbiter. Источник: ESA / Ken and Keli Chaffin

Расшифрованный сигнал, по словам ESA, наводит на мысль о возможной информации о формировании клеток или жизни. Однако расшифровка сигнала — это только первый шаг. Теперь гражданским учёным предстоит интерпретировать содержание сообщения и найти в нём возможный смысл.

Проект "призван подготовить человечество к возможному контакту с внеземными цивилизациями. Даниэла де Паулис, художник-резидент в Институте SETI и обсерватории Грин-Бэнк, считает, что «получение сообщения от внеземной цивилизации станет глубоко преобразующим опытом для всего человечества. "Знак в космосе" предлагает беспрецедентную возможность наглядно отрепетировать и подготовиться к этому сценарию посредством глобального сотрудничества, способствуя открытому поиску смысла во всех культурах и дисциплинах».

Иллюстрация космического аппарата Trace Gas Orbiter на орбите Марса. Источник: ESA / ATG medialab

Однако интерпретация истинно инопланетного сообщения может оказаться гораздо более сложной задачей. Наши представления о языке, данных, информации и коммуникации основаны на земных процессах и опыте. Нам трудно представить, как эти процессы могут работать на экзопланетах с жизнью.

Ваэль Фарах, научный сотрудник проекта Allen Telescope Array Института SETI, подчеркнул, что «больше, чем данных об астрономии, общение с инопланетянами потребует широты знаний». «Знак в космосе» призван объединить сообщество для решения этой задачи и продемонстрировать ценность нестандартного мышления, которое может потребоваться при обнаружении настоящего инопланетного радиосигнала.

Прочитать...

Новый метод прогнозирования долгопериодических комет поможет в поиске угроз столкновения с Землёй

Автор: ixbt Дата: 03.11.2024 22:50

3 0 0

Новая методика прогнозирования долгопериодических комет может радикально улучшить поиск угроз столкновения с Землёй. Кометы, прибывающие из облака Оорта, могут представлять угрозу для нашей планеты, если их орбиты пересекают орбиту Земли. Однако, до сих пор было сложно предсказать траекторию большинства комет, особенно долгопериодических, которые могут не возвращаться в течение сотен или тысяч лет.

Новое исследование, опубликованное на сервере препринтов arXiv, предлагает решение этой проблемы. Команда учёных провела моделирование комет с длительным периодом обращения от 200 до 4000 лет и оценила пылевые следы, которые они оставят. Затем авторы работы определили, могут ли астрономы использовать эти следы для поиска исходной кометы, пока она находится далеко от Солнца.

Используя ожидаемое разрешение обсерватории имени Веры Рубин, команда обнаружила, что орбиты многих комет не производят потоки, полезные для прогнозирования. Однако, в 17 случаях потоки можно было использовать для идентификации комет за месяцы или годы до того, как их обычно замечают.

Иллюстрация долгопериодических комет и облака Оорта. Источник: National Astronomical Observatory of Japan

Чтобы продемонстрировать эффективность этого метода, команда также рассмотрела метеорный поток, называемый σ-Гидридами, слабый поток, который появляется в начале декабря. Происхождение σ-Гидрид не было известно до появления кометы Нисимура в 2023 году. Используя существующие наблюдения за потоком до 2023 года, команда смогла определить возможную орбиту кометы. Они обнаружили, что с возможностями подобными обсерватории «Рубин», астрономы могли бы найти Нисимуру за восемь месяцев до фактического открытия.

«Этот метод может стать полезным инструментом в поиске угроз столкновения. По мере появления новых телескопов, таких как обсерватория Веры Рубин, мы сможем идентифицировать долгопериодические кометы гораздо раньше, что даст больше времени для подготовки и потенциального предотвращения столкновения», — говорит один из авторов исследования.

Хотя большинство комет с длительным периодом не представляют угрозы, некоторые из них могут представлять риск столкновения.

Прочитать...

Удивительное совместное открытие телескопов «Хаббл» и «Джеймс Уэбб»: гладкий диск Веги без планет-гигантов

Автор: ixbt Дата: 03.11.2024 22:50

4 0 0

Группа астрономов из Университета Аризоны провела беспрецедентно детальное исследование космического диска из обломков, окружающего звезду Вега, используя космические телескопы «Хаббл» и «Джеймс Уэбб» (JWST). Вега, одна из самых ярких звёзд на северном небе, расположена в созвездии Лиры и известна тем, что предоставила первые доказательства существования вещества, вращающегося вокруг звезды, потенциально пригодного для формирования планет.

Телескопы «Хаббл» и «Уэбб» позволили получить чёткое изображение Веги и её диска. «Диск Веги удивительно гладкий», — отметил Андраш Гашпар, член исследовательской группы. Большим сюрпризом стало отсутствие очевидных доказательств наличия крупных планет, пробирающихся сквозь диск. «Это заставляет нас переосмыслить диапазон и разнообразие экзопланетных систем», — сказала Кейт Су, ведущий автор статьи, представляющей выводы JWST.

(слева) Изображение в искусственных цветах космического телескопа «Хаббл». Телескоп обнаружил отражённый свет от пыли в основном в гало на периферии диска. Диск очень гладкий, без признаков вкрапленных крупных планет. (справа) JWST разрешил свечение тёплой пыли в гало диска. Внешний диск (аналог пояса Койпера Солнечной системы) простирается от 7 миллиардов миль до 15 миллиардов миль. Внутренний диск простирается от внутреннего края внешнего диска вниз до непосредственной близости к звезде. Источник: NASA, ESA, CSA, STScI, S. Wolff (University of Arizona), K. Su (University of Arizona), A. Gáspár (University of Arizona)

«Уэбб» видит инфракрасное свечение от диска частиц размером с песок, вращающихся вокруг Веги, в то время как «Хаббл» захватывает внешний ореол этого диска с частицами не больше консистенции дыма. Распределение пыли в диске является слоистым, поскольку давление звёздного света выталкивает более мелкие частицы быстрее, чем более крупные. «Тот факт, что мы видим, как размеры частиц пыли сортируются, может помочь нам понять базовую динамику в околозвёздных дисках», — сказала Шайлер Вольф, ведущий автор статьи, представляющей результаты «Хаббла».

Диск Веги имеет едва заметный зазор, но в остальном он очень гладкий на всём протяжении, пока не теряется в сиянии звезды. Это показывает, что нет планет, по крайней мере, с массой Нептуна, вращающихся по большим орбитам, как в Солнечной системе. «Мы видим, насколько разнообразны околозвёздные диски и как это разнообразие связано с лежащими в их основе планетными системами», — добавила Су.

Вега продолжает оставаться необычной, её архитектура заметно отличается от Солнечной системы. Для сравнения, звезда Фомальгаут, которая находится примерно на том же расстоянии, схожего возраста и температуры, что и Вега, имеет три вложенных пояса обломков. «Учитывая физическое сходство между звёздами Вега и Фомальгаут, почему Фомальгаут, похоже, смог сформировать планеты, а Вега — нет?» — задаётся вопросом член исследовательской группы Джордж Рике.

Наблюдения «Хаббла» и «Уэбба» вместе дают гораздо больше подробностей о системе звезды Вега, чем было известно ранее. «Эти новые наблюдения помогут ограничить модели формирования планет», — заключила Су.

Прочитать...

Передача эстафеты: Китайская космическая станция «Тяньгун» встретила новый экипаж «Шэньчжоу-19»

Автор: ixbt Дата: 03.11.2024 22:50

3 0 0

Китайская космическая станция «Тяньгун» официально передана новому экипажу «Шэньчжоу-19», который прибыл на станцию 30 октября после успешного запуска с космодрома Цзюцюань на северо-западе Китая. Командир «Шэньчжоу-18» Е Гуанфу, который недавно стал первым тайконавтом, проведшим в общей сложности 365 дней в космосе, передал символический ключ командиру «Шэньчжоу-19» Цаю Сюйчжэ 1 ноября.

Экипаж «Шэньчжоу-19» состоит из 48-летнего Цая и двух новичков — Сун Линдуна и Ван Хаозе, оба родились в 1990 году. Ван Хаозе является единственной в Китае женщиной-инженером космических полетов. Они проведут на борту космической станции следующие шесть месяцев, выполняя 86 научных проектов и экспериментов, включая выход в открытый космос.

Экипаж «Шэньчжоу-18» передает управление космической станцией «Тяньгун» недавно прибывшим тайконавтам миссии «Шэньчжоу-19». Источник: CCTV

Одним из наиболее примечательных экспериментов будет отправка кирпича, сделанного из имитатора лунного грунта, на «Тяньгун» для размещения за пределами космической станции. Исследователи хотят изучить, как кирпичи, сделанные из лунного реголита, выдерживают экстремальные условия, чтобы помочь спланировать будущий форпост на поверхности Луны. Кирпич должен прибыть на борту грузовой миссии по пополнению запасов «Тяньчжоу-8» в конце ноября.

Тем временем, экипаж «Шэньчжоу-18» готовится к возвращению на Землю. Ожидается, что они приземлятся в районе посадки Дунфэн около космодрома Цзюцюань 3 ноября.

Космическая станция является важным шагом в амбициозной космической программе Китая, которая включает в себя создание постоянной орбитальной станции и высадку астронавтов на Луну. «Тяньгун» оснащена современным научным оборудованием и технологиями, которые позволят проводить исследования в области микрогравитации, биологии, физики и других областях.

Как отметил Цай Сюйчжэ, командир 19-й миссии, «мы будем работать над тем, чтобы выполнить все запланированные задачи и внести свой вклад в развитие китайской космической программы». Эксперты также подчёркивают важность этой миссии для Китая и мирового космического сообщества. «Китайская космическая программа продолжает развиваться, и успешная передача станции новому экипажу является ещё одним важным шагом в этом процессе», — заявил Жан-Франсуа Клери, эксперт по космической политике в Фонде стратегических исследований в Париже.

Прочитать...

Солнце устроило мощную Хэллоуинскую вспышку X2.0

Автор: ixbt Дата: 03.11.2024 21:50

1 0 0

Солнце устроило впечатляющее шоу на Хэллоуин, вызвав мощную солнечную вспышку X2.0, которая произошла в 5:20 вечера по восточному поясному времени (2120 UTC) 31 октября. Источником вспышки стало солнечное пятно AR 3878 — тёмная область размером с планету на Солнце, где сильные магнитные поля внутри звезды достигают поверхности.

Солнечные вспышки классифицируются по шкале из четырёх уровней, где класс X является наиболее мощным, в десять раз превышая по силе класс M. В данном случае, вспышка X2.0 была достаточно мощной, чтобы достичь уровня R3-Strong по шкале космической погоды для радиоотключений Центра прогнозирования космической погоды (SWPC) Национального управления океанических и атмосферных исследований (NOAA). В результате большого количества выпущенного ультрафиолетового излучения, было зарегистрировано коротковолновое радиоотключение в некоторых частях Тихого океана.

Источник: NOAA / SWPC

«Хотя в этот раз у нас не будет возможности увидеть северное сияние, мы продолжаем следить за активностью Солнца и ожидаем дополнительных мощных вспышек в ближайшие дни», — заявил представитель SWPC.

Полярные сияния являются результатом взаимодействия корональных выбросов массы с магнитным полем Земли, которое направляет заряженные частицы к полюсам. Это световое шоу чаще всего наблюдается вблизи полюсов.

Несмотря на отсутствие CME в данном случае, солнечная вспышка X2.0 является важным событием в изучении космической погоды и её влияния на Землю. Такие события помогают лучше понять процессы, происходящие на Солнце, и улучшить прогнозирование космической погоды, что имеет важное значение для защиты спутников, коммуникационных систем и электросетей на Земле.

Прочитать...

NASA призывает SpaceX усилить меры безопасности после серии инцидентов в пилотируемых полётах

Автор: ixbt Дата: 03.11.2024 21:50

1 0 0

Недавняя серия аномалий в работе SpaceX вызвала обеспокоенность комиссии по безопасности NASA, которая призвала компанию сосредоточиться на безопасности пилотируемых полетов. На заседании Консультативной группы по безопасности в аэрокосмической сфере (ASAP) 31 октября бывший астронавт Кент Ромингер рассмотрел список «недавних проблем» с ракетой Falcon 9 и космическим кораблём Dragon.

Проблемы включали неудачный запуск Falcon 9 в июле, когда вторая ступень не смогла выполнить второй запуск, и аномалию двигателя верхней ступени при запуске Falcon 9 миссии Crew-9 28 сентября. Кроме того, в августе был потерян ускоритель Falcon 9 при попытке посадки.

Ромингер подчеркнул, что безопасная эксплуатация требует значительного внимания к деталям, особенно в условиях старения оборудования и увеличения темпов эксплуатации. Он отметил, что и NASA, и SpaceX должны сосредоточиться на безопасной эксплуатации Crew Dragon и не принимать любые «нормальные» операции как должное.

Ракета-носитель Falcon 9 стартует с SLC-40 в рамках миссии Crew-9 на МКС 28 сентября. Источник: NASA

Ромингер также одобрил решение SpaceX и NASA переместить приводнение Dragon с побережья Флориды к побережью Калифорнии, что должно улучшить контроль за возвращением в атмосферу секции Dragon. «Похоже, это очень хорошее изменение, которое принесёт пользу как безопасности, так и операциям по восстановлению Dragon», — сказал он.

Другой член комиссии, Чарли Прекорт, отметил, что высокий уровень активности SpaceX имеет свои преимущества, предоставляя больше данных для понимания работы систем.

Группа также обсудила недавний испытательный полёт пилотируемого корабля Starliner, который завершился решением NASA вернуть космический корабль без экипажа из-за проблем с двигателями и утечками гелия. Ромингер похвалил NASA за анализ проблем и процесс принятия решений, отметив, что многие люди были готовы высказаться, что является показателем здоровой культуры безопасности.

Председатель ASAP Сьюзан Хелмс подчеркнула, что «NASA ясно продемонстрировало атрибуты здоровой культуры безопасности», и похвалила агентство за соответствующие результаты управления рисками.

Прочитать...

Coinbase отчиталась о четвёртой квартальной прибыли и объявила о выкупе акций на $1 млрд

Автор: ixbt Дата: 03.11.2024 21:50

2 0 0

Криптовалютная биржа Coinbase продолжает демонстрировать стабильную прибыльность, отчитавшись о четвёртой квартальной прибыли подряд и объявив о выкупе акций на сумму до $1 миллиарда. Несмотря на колебания на рынке криптовалют, компания смогла увеличить свою выручку почти на 80% в годовом исчислении, достигнув $1,2 млрд в третьем квартале. Однако, по сравнению со вторым кварталом, выручка снизилась, что связано с природой бизнеса Coinbase, который в значительной степени зависит от комиссий за криптовалютные сделки.

Coinbase также отметила рост торговли стейблкоинами, которые привязаны к стабильным активам, таким как доллар США. Хотя компания получает мало или вообще не получает комиссий за эти сделки, руководители заявили, что растущее принятие стейблкоинов способствует развитию общего бизнеса. Coinbase получает доход через партнёрство с Circle, которая выпускает стейблкоины, и разделяет проценты, генерируемые резервами, обеспечивающими стейблкоины. Доход от этого партнёрства вырос на 43% в годовом исчислении и примерно не изменился по сравнению с предыдущим периодом.

Источник: Gabby Jones / The New York Times

Coinbase прогнозирует дальнейший рост доходов от стейблкоинов и других неторговых операций в четвёртом квартале. Компания ожидает, что доход от этих операций составит от $505 миллионов до $580 миллионов, по сравнению с $375 миллионами за тот же период годом ранее и $556 миллионами в третьем квартале.

«Мы продолжаем фокусироваться на стратегических приоритетах, включая расширение предложения продуктов и услуг, а также укрепление позиций на ключевых рынках. Наши результаты в третьем квартале демонстрируют способность генерировать стабильную прибыль даже в условиях волатильности рынка криптовалют», — заявил Брайан Армстронг, генеральный директор Coinbase.

Coinbase также продолжает инвестировать в развитие технологической инфраструктуры и безопасности. Компания использует передовые технологии шифрования и многофакторной аутентификации для защиты пользовательских данных и активов. Кроме того, Coinbase активно участвует в разработке и продвижении регуляторных инициатив, направленных на обеспечение прозрачности и безопасности рынка криптовалют.

«Мы считаем, что регуляция является ключевым фактором для дальнейшего роста и развития рынка криптовалют. Мы продолжаем работать с регуляторами и законодателями, чтобы обеспечить создание справедливой и прозрачной регуляторной среды для криптовалют», — отметил Аруп Датта, финансовый директор Coinbase.

Прочитать...

В России продают уникальный ВАЗ-2105 в состоянии «капсула времени»: экспортная версия, пробег 10 км, двери даже не открывались

Автор: ixbt Дата: 03.11.2024 21:50

2 0 0

В Тольятти, на родине «Жигулей», выставили на продажу экспортный ВАЗ-2105 в состоянии будто вчера с конвейера. Машина предназначалась для экспорта в Литву, но дефолт 1998 года внес свои коррективы – «пятерка» осталась в России.

Скриншот сайта Avito Авто

В техническом плане все стандартно – 1,5-литровый мотор мощностью 71 л.с. сочетается с 5-ступенчатой механической коробкой передач. Привод классический – задний. Просят за уникальную «капсулу времени» впечатляющую сумму – 10 млн рублей.

Прочитать...

16+ Сайт может содержать контент, не предназначенный для лиц младше 16 лет