Космическая плазма. Плазменные кристаллы: от космических исследований до медицинских применений на Земле и вновь обратно в космос. Миссия «Cluster», восставшая из огня подобно Фениксу

Сегодня граф – один из самых приемлемых способов описать модели, созданные в системе машинного обучения. Эти вычислительные графики составлены из вершин-нейронов, соединенных ребрами-синапсами, которые описывают связи между вершинами.

В отличие скалярного центрального или векторного графического процессора, IPU – новый тип процессоров, спроектированный для машинного обучения, позволяет строить такие графы. Компьютер, который предназначен для управления графами – идеальная машина для вычислительных моделей графов, созданных в рамках машинного обучения.

Один из самых простых способов, чтобы описать процесс работы машинного интеллекта – это визуализировать его. Команда разработчиков компании Graphcore создала коллекцию таких изображений, отображаемых на IPU. В основу легло программное обеспечение Poplar, которое визуализирует работу искусственного интеллекта. Исследователи из этой компании также выяснили, почему глубокие сети требуют так много памяти, и какие пути решения проблемы существуют.

Poplar включает в себя графический компилятор, который был создан с нуля для перевода стандартных операций, используемых в рамках машинного обучения в высокооптимизированный код приложений для IPU. Он позволяет собрать эти графы воедино по тому же принципу, как собираются POPNN. Библиотека содержит набор различных типов вершин для обобщенных примитивов.

Графы – это парадигма, на которой основывается все программное обеспечение. В Poplar графы позволяют определить процесс вычисления, где вершины выполняют операции, а ребра описывают связь между ними. Например, если вы хотите сложить вместе два числа, вы можете определить вершину с двумя входами (числа, которые вы хотели бы сложить), некоторые вычисления (функция сложения двух чисел) и выход (результат).

Обычно операции с вершинами гораздо сложнее, чем в описанном выше примере. Зачастую они определяются небольшими программами, называемыми коделетами (кодовыми именами). Графическая абстракция привлекательна, поскольку не делает предположений о структуре вычислений и разбивает вычисления на компоненты, которые процессор IPU может использовать для работы.

Poplar применяет эту простую абстракцию для построения очень больших графов, которые представлены в виде изображения. Программная генерация графика означает, что мы можем адаптировать его к конкретным вычислениям, необходимым для обеспечения наиболее эффективного использования ресурсов IPU.

Компилятор переводит стандартные операции, используемые в машинных системах обучения, в высокооптимизированный код приложения для IPU. Компилятор графов создает промежуточное изображение вычислительного графа, которое разворачивается на одном или нескольких устройствах IPU. Компилятор может отображать этот вычислительный граф, поэтому приложение, написанное на уровне структуры нейронной сети, отображает изображение вычислительного графа, который выполняется на IPU.


Граф полного цикла обучения AlexNet в прямом и обратном направлении

Графический компилятор Poplar превратил описание AlexNet в вычислительный граф из 18,7 миллиона вершин и 115,8 миллиона ребер. Четко видимая кластеризация – результат прочной связи между процессами в каждом слое сети с более легкой связью между уровнями.

Другой пример – простая сеть с полной связью, прошедшая обучение на MNIST – простом наборе данных для компьютерного зрения, своего рода «Hello, world» в машинном обучении. Простая сеть для изучения этого набора данных помогает понять графы, которыми управляют приложения Poplar. Интегрируя библиотеки графов с такими средами, как TensorFlow, компания представляет один из простых путей для использования IPU в приложениях машинного обучения.

После того, как с помощью компилятора построился граф, его нужно выполнить. Это возможно с помощью движка Graph Engine. На примере ResNet-50 демонстрируется его работа.


Граф ResNet-50

Архитектура ResNet-50 позволяет создавать глубокие сети из повторяющихся разделов. Процессору остается только единожды определить эти разделы и повторно вызывать их. Например, кластер уровня conv4 выполняется шесть раз, но только один раз наносится на граф. Изображение также демонстрирует разнообразие форм сверточных слоев, поскольку каждый из них имеет граф, построенный в соответствии с естественной формой вычисления.

Движок создает и управляет исполнением модели машинного обучения, используя граф, созданный компилятором. После развертывания Graph Engine контролирует и реагирует на IPU или устройства, используемые приложениями.

Изображение ResNet-50 демонстрирует всю модель. На этом уровне сложно выделить связи между отдельными вершинами, поэтому стоит посмотреть на увеличенные изображения. Ниже приведены несколько примеров секций внутри слоев нейросети.

Почему глубоким сетям нужно так много памяти?

Большие объемы занимаемой памяти – одна из самых больших проблем глубинных нейронных сетей. Исследователи пытаются бороться с ограниченной пропускной способностью DRAM-устройств, которые должны быть использованы современными системами для хранения огромного количества весов и активаций в глубинной нейронной сети.

Архитектуры были разработаны с использованием процессорных микросхем, предназначенных для последовательной обработки и оптимизации DRAM для высокоплотной памяти. Интерфейс между двумя этими устройствами является узким местом, которое вводит ограничения пропускной способности и добавляет значительные накладные расходы в потреблении энергии.

Хотя мы еще не имеем полного представления о человеческом мозге и о том, как он работает, в целом понятно, что нет большого отдельного хранилища памяти. Считается, что функция долговременной и кратковременной памяти в человеческом мозге встроена в структуру нейронов+синапсов. Даже простые организмы вроде червей с нейронной структурой мозга, состоящей из чуть более 300 нейронов, обладают в какой-то степени функцией памяти.

Построение памяти в обычных процессорах – это один из способов обойти проблему узких мест памяти, открыв огромную пропускную способность при гораздо меньшем энергопотреблении. Тем не менее, память на кристалле – дорогая штука, которая не рассчитана на действительно большие объемы памяти, которые подключены к центральным и графическим процессорам, в настоящее время используемым для подготовки и развертывания глубинных нейронных сетей.

Поэтому полезно посмотреть на то, как память сегодня используется в центральных процессорах и системах глубокого обучения на графических ускорителях, и спросить себя: почему для них необходимы такие большие устройства хранения памяти, когда головной мозг человека отлично работает без них?

Нейронным сетям нужна память для того, чтобы хранить входные данные, весовые параметры и функции активации, как вход распространяется через сеть. В обучении активация на входе должна сохраняться до тех пор, пока ее нельзя будет использовать, чтобы вычислить погрешности градиентов на выходе.

Например, 50-слойная сеть ResNet имеет около 26 миллионов весовых параметров и вычисляет 16 миллионов активаций в прямом направлении. Если вы используете 32-битное число с плавающей запятой для хранения каждого веса и активации, то для этого потребуется около 168Мб пространства. Используя более низкое значение точности для хранения этих весов и активаций, мы могли бы вдвое или даже вчетверо снизить это требование для хранения.

Серьезная проблема с памятью возникает из-за того, что графические процессоры полагаются на данные, представляемые в виде плотных векторов. Поэтому они могут использовать одиночный поток команд (SIMD) для достижения высокой плотности вычислений. Центральный процессор использует аналогичные векторные блоки для высокопроизводительных вычислений.

В графических процессорах ширина синапса составляет 1024 бит, так что они используют 32-битные данные с плавающей запятой, поэтому часто разбивают их на параллельно работающие mini-batch из 32 образцов для создания векторов данных по 1024 бит. Этот подход к организации векторного параллелизма увеличивает число активаций в 32 раза и потребность в локальном хранилище емкостью более 2 ГБ.

Графические процессоры и другие машины, предназначенные для матричной алгебры, также подвержены нагрузке на память со стороны весов или активаций нейронной сети. Графические процессоры не могут эффективно выполнять небольшие свертки, используемые в глубоких нейронных сетях. Поэтому преобразование, называемое «понижением», используется для преобразования этих сверток в матрично-матричные умножения (GEMM), с которыми графические ускорители могут эффективно справляться.

Дополнительная память также требуется для хранения входных данных, временных значений и инструкций программы. Измерение использования памяти при обучении ResNet-50 на высокопроизводительном графическом процессоре показало, что ей требуется более 7,5 ГБ локальной DRAM.

Возможно, кто-то решит, что более низкая точность вычислений может сократить необходимый объем памяти, но это не так. При переключении значений данных до половинной точности для весов и активаций вы заполните только половину векторной ширины SIMD, потратив половину имеющихся вычислительных ресурсов. Чтобы компенсировать это, когда вы переключаетесь с полной точности до половины точности на графическом процессоре, тогда придется удвоить размер mini-batch, чтобы вызвать достаточный параллелизм данных для использования всех доступных вычислений. Таким образом, переход на более низкую точность весов и активаций на графическом процессоре все еще требует более 7,5ГБ динамической памяти со свободным доступом.

С таким большим количеством данных, которые нужно хранить, уместить все это в графическом процессоре просто невозможно. На каждом слое сверточной нейронной сети необходимо сохранить состояние внешней DRAM, загрузить следующий слой сети и затем загрузить данные в систему. В результате, уже ограниченный пропускной способностью задержкой памяти интерфейс внешней памяти страдает от дополнительного бремени постоянной перезагрузки весов, а также сохранения и извлечения функций активации. Это значительно замедляет время обучения и значительно увеличивает потребление энергии.

Существует несколько путей решения этой проблемы. Во-первых, такие операции, как функции активации, могут выполняться “на местах”, позволяя перезаписывать входные данные непосредственно на выходе. Таким образом, существующую память можно будет использовать повторно. Во-вторых, возможность для повторного использования памяти можно получить, проанализировав зависимость данных между операциями в сети и распределением той же памяти для операций, которые не используют ее в этот момент.

Второй подход особенно эффективен, когда вся нейронная сеть может быть проанализированна на этапе компиляции, чтобы создать фиксированную выделенную память, так как издержки на управление памятью сокращаются почти до нуля. Выяснилось, что комбинация этих методов позволяет сократить использование памяти нейронной сетью в два-три раза.
Третий значительный подход был недавно обнаружен командой Baidu Deep Speech. Они применили различные методы экономии памяти, чтобы получить 16-кратное сокращение потребления памяти функциями активации, что позволило им обучать сети со 100 слоями. Ранее при том же объеме памяти они могли обучать сети с девятью слоями.

Объединение ресурсов памяти и обработки в одном устройстве обладает значительным потенциалом для повышения производительности и эффективности сверточных нейронных сетей, а также других форм машинного обучения. Можно сделать компромисс между памятью и вычислительными ресурсами, чтобы добиться баланса возможностей и производительности в системе.

Нейронные сети и модели знаний в других методах машинного обучения можно рассматривать как математические графы. В этих графах сосредоточено огромное количество параллелизма. Параллельный процессор, предназначенный для использования параллелизма в графах, не полагается на mini-batch и может значительно уменьшить объем требуемого локального хранилища.

Современные результаты исследований показали, что все эти методы могут значительно улучшить производительность нейронных сетей. Современные графические и центральные процессоры имеют очень ограниченную встроенную память, всего несколько мегабайт в совокупности. Новые архитектуры процессоров, специально разработанные для машинного обучения, обеспечивают баланс между памятью и вычислениями на чипе, обеспечивая существенное повышение производительности и эффективности по сравнению с современными центральными процессорами и графическими ускорителями.

И частях, это руководство предназначено для всех, кто интересуется машинным обучением, но не знает, с чего начать. Содержание статей рассчитано на широкую аудиторию и будет достаточно поверхностным. Но разве это кого-то волнует? Чем больше людей заинтересуются машинным обучением, тем лучше.

Распознавание объектов с помощью глубокого обучения

Возможно, вы уже видели этот знаменитый комикс xkcd . Шутка в том, что любой 3-летний ребенок может распознать фотографию птицы, но заставить это сделать компьютер заняло у самых лучших компьютерных специалистов более 50 лет.В последние несколько лет мы наконец-то нашли хороший подход к распознаванию объектов с использованием глубоких сверточных нейронных сетей . Это звучит как куча выдуманных слов из фантастического романа Уильяма Гибсона, но все станет понятным, когда мы разберем их по очереди.Итак, давайте же сделаем это – напишем программу, распознающую птиц!

Начнем с простого

Прежде чем научиться распознавать изображения птиц, давайте узнаем, как распознать что-то гораздо более простое – рукописную цифру «8».

Искусственный интеллект, нейронные сети, машинное обучение — что на самом деле означают все эти нынче популярные понятия? Для большинства непосвященных людей, коим и являюсь я сам, они всегда казались чем-то фантастическим, но на самом деле суть их лежит на поверхности. У меня давно созревала идея написать простым языком об искусственных нейронных сетях. Узнать самому и рассказать другим, что представляют собой эта технология, как она работают, рассмотреть ее историю и перспективы. В этой статье я постарался не залезать в дебри, а просто и популярно рассказать об этом перспективном направление в мире высоких технологий.

Искусственный интеллект, нейронные сети, машинное обучение - что на самом деле означают все эти нынче популярные понятия? Для большинства непосвященных людей, коим являюсь и я сам, они всегда казались чем-то фантастическим, но на самом деле суть их лежит на поверхности. У меня давно созревала идея написать простым языком об искусственных нейронных сетях. Узнать самому и рассказать другим, что представляет собой эта технология, как она работает, рассмотреть ее историю и перспективы. В этой статье я постарался не залезать в дебри, а просто и популярно рассказать об этом перспективном направление в мире высоких технологий.

Немного истории

Впервые понятие искусственных нейронных сетей (ИНС) возникло при попытке смоделировать процессы головного мозга. Первым серьезным прорывом в этой сфере можно считать создание модели нейронных сетей МакКаллока-Питтса в 1943 году. Учеными впервые была разработана модель искусственного нейрона. Ими также была предложена конструкция сети из этих элементов для выполнения логических операций. Но самое главное, учеными было доказано, что подобная сеть способна обучаться.

Следующим важным шагом стала разработка Дональдом Хеббом первого алгоритма вычисления ИНС в 1949 году, который стал основополагающем на несколько последующих десятилетий. В 1958 году Фрэнком Розенблаттом был разработан парцептрон - система, имитирующая процессы головного мозга. В свое время технология не имела аналогов и до сих пор является основополагающей в нейронных сетях. В 1986 году практически одновременно, независимо друг от друга американскими и советскими учеными был существенно доработан основополагающий метод обучения многослойного перцептрона . В 2007 году нейронные сети перенесли второе рождение. Британский информатик Джеффри Хинтоном впервые разработал алгоритм глубокого обучения многослойных нейронных сетей, который сейчас, например, используется для работы беспилотных автомобилей.

Коротко о главном

В общем смысле слова, нейронные сети - это математические модели, работающие по принципу сетей нервных клеток животного организма. ИНС могут быть реализованы как в программируемые, так и в аппаратные решения. Для простоты восприятия нейрон можно представить, как некую ячейку, у которой имеется множество входных отверстий и одно выходное. Каким образом многочисленные входящие сигналы формируются в выходящий, как раз и определяет алгоритм вычисления. На каждый вход нейрона подаются действенные значения, которые затем распространяются по межнейронным связям (синопсисам). У синапсов есть один параметр - вес, благодаря которому входная информация изменяется при переходе от одного нейрона к другому. Легче всего принцип работы нейросетей можно представить на примере смешения цветов. Синий, зеленый и красный нейрон имеют разные веса. Информация того нейрона, вес которого больше будет доминирующей в следующем нейроне.

Сама нейросеть представляет собой систему из множества таких нейронов (процессоров). По отдельности эти процессоры достаточно просты (намного проще, чем процессор персонального компьютера), но будучи соединенными в большую систему нейроны способны выполнять очень сложные задачи.

В зависимости от области применения нейросеть можно трактовать по-разному, Например, с точки зрения машинного обучения ИНС представляет собой метод распознавания образов. С математической точки зрения - это многопараметрическая задача. С точки зрения кибернетики - модель адаптивного управления робототехникой. Для искусственного интеллекта ИНС - это основополагающее составляющее для моделирования естественного интеллекта с помощью вычислительных алгоритмов.

Основным преимуществом нейросетей над обычными алгоритмами вычисления является их возможность обучения. В общем смысле слова обучение заключается в нахождении верных коэффициентов связи между нейронами, а также в обобщении данных и выявлении сложных зависимостей между входными и выходными сигналами. Фактически, удачное обучение нейросети означает, что система будет способна выявить верный результат на основании данных, отсутствующих в обучающей выборке.

Сегодняшнее положение

И какой бы многообещающей не была бы эта технология, пока что ИНС еще очень далеки от возможностей человеческого мозга и мышления. Тем не менее, уже сейчас нейросети применяются во многих сферах деятельности человека. Пока что они не способны принимать высокоинтеллектуальные решения, но в состоянии заменить человека там, где раньше он был необходим. Среди многочисленных областей применения ИНС можно отметить: создание самообучающихся систем производственных процессов, беспилотные транспортные средства, системы распознавания изображений, интеллектуальные охранные системы, робототехника, системы мониторинга качества, голосовые интерфейсы взаимодействия, системы аналитики и многое другое. Такое широкое распространение нейросетей помимо прочего обусловлено появлением различных способов ускорения обучения ИНС.

На сегодняшний день рынок нейронных сетей огромен - это миллиарды и миллиарды долларов. Как показывает практика, большинство технологий нейросетей по всему миру мало отличаются друг от друга. Однако применение нейросетей - это очень затратное занятие, которое в большинстве случаев могут позволить себе только крупные компании. Для разработки, обучения и тестирования нейронных сетей требуются большие вычислительные мощности, очевидно, что этого в достатке имеется у крупных игроков на рынке ИТ. Среди основных компаний, ведущих разработки в этой области можно отметить подразделение Google DeepMind, подразделение Microsoft Research, компании IBM, Facebook и Baidu.

Конечно, все это хорошо: нейросети развиваются, рынок растет, но пока что главная задача так и не решена. Человечеству не удалось создать технологию, хотя бы приближенную по возможностям к человеческому мозгу. Давайте рассмотрим основные различия между человеческим мозгом и искусственными нейросетями.

Почему нейросети еще далеки до человеческого мозга?

Самым главным отличием, которое в корне меняет принцип и эффективность работы системы - это разная передача сигналов в искусственных нейронных сетях и в биологической сети нейронов. Дело в том, что в ИНС нейроны передают значения, которые являются действительными значениями, то есть числами. В человеческом мозге осуществляется передача импульсов с фиксированной амплитудой, причем эти импульсы практически мгновенные. Отсюда вытекает целый ряд преимуществ человеческой сети нейронов.

Во-первых, линии связи в мозге намного эффективнее и экономичнее, чем в ИНС. Во-вторых, импульсная схема обеспечивает простоту реализации технологии: достаточно использование аналоговых схем вместо сложных вычислительных механизмов. В конечном счете, импульсные сети защищены от звуковых помех. Действенные числа подвержены влиянию шумов, в результате чего повышается вероятность возникновения ошибки.

Итог

Безусловно, в последнее десятилетие произошел настоящий бум развития нейронных сетей. В первую очередь это связано с тем, что процесс обучения ИНС стал намного быстрее и проще. Также стали активно разрабатываться так называемые «предобученные» нейросети, которые позволяют существенно ускорить процесс внедрения технологии. И если пока что рано говорить о том, смогут ли когда-то нейросети полностью воспроизвести возможности человеческого мозга, вероятность того, что в ближайшее десятилетие ИНС смогут заменить человека на четверти существующих профессий все больше становится похожим на правду.

Для тех, кто хочет знать больше

  • Большая нейронная война: что на самом деле затевает Google
  • Как когнитивные компьютеры могут изменить наше будущее

В космич. пространстве и космич. объектах. К. п. условно можно разделить по предметам исследований: околопланетная, межпланетная плазма, плазма звёзд и звёздных атмосфер, плазма квазаров и галактич. ядер, межзвёздная и межгалактич. плазма. Указанные типы К. п. различаются своими параметрами (ср. плотностями п , ср. энергиями частиц и т. п.), а также состояниями: термодинамически равновесными, частично или полностью неравновесными.

Межпланетная К. п . Состояние околопланетной плазмы, а также структура занимаемого ею пространства зависят от наличия собственного магн. поля у планеты и её удалённости от Солнца. Магн. поле планеты существенно увеличивает область удержания околопланетной плазмы, образуя естественные магнитные ловушки .Поэтому область удержания околопланетной плазмы является неоднородной. Большую роль в формировании околопланетной плазмы играют потоки солнечной плазмы, двигающиеся практически ради-ально от Солнца (т. н. солнечный ветер ),плотности к-рых падают с расстоянием от Солнца. Непосредственные измерения плотности частиц солнечного ветра вблизи Земли с помощью космич. аппаратов дают значения п (1-10) см -3 . Плазма околоземного космич. пространства обычно разделяется на плазму ионосферы , имеющую плотность п до 10 5 см -3 на высотах 350 км, плазму радиационных поясов Земли (п 10 7 см -3) и магнитосферы Земли ; вплоть до неск. радиусов Земли простирается т. н. плазмосфера, плотность к-рой п 10 2 см -3 .

Особенность плазмы верх. ионосферы, радиац. поясов и магнитосферы в том, что она является бесстолкновительной, т. е. пространственно-временные масштабы волновых и колебат. процессов в ней намного меньше столкновительных. Релаксация по энергиям и импульсам протекает не за счёт столкновений, а через возбуждение коллективных степеней свободы плазмы - колебаний и волн. В плазме подобного типа, как правило, отсутствует термодинамич. равновесие, в частности между электронной и ионной компонентами. Быстропротекающие процессы в них, напр. ударные волны, также определяются возбуждением мелкомасштабных колебаний и волн. Характерным примером является бесстолкновительная ударная волна, образующаяся при обтекании солнечным ветром магнитосферы Земли.

Звёздная К. п . Солнце и звёзды можно рассматривать как гигантские сгустки К. п. с плотностью, постоянно возрастающей от внеш. частей к центру: корона, хромосфера, фотосфера, конвективная зона, ядро. В т. н. нормальных звёздах высокие темп-ры обеспечивают термич. ионизацию вещества и переход его в состояние плазмы. Высокое давление плазмы поддерживает гидростатич. равновесие. Макс. расчётная плотность К. п. в центре нормальных звёзд п 10 24 см -3 , темп-pa до 10 9 К. Несмотря на высокие плотности, плазма здесь обычно идеальная за счёт высоких темп-р; только в звёздах с малыми массами (0.5 массы Солнца) появляются эффекты, связанные с неидеальностью плазмы. В центр. областях нормальных звёзд длины свободного пробега частиц малы, поэтому плазма в них столкновительная, равновесная; в верх. слоях, в особенности хромосфере и короне, плазма бесстолкновительная. (Эти расчётные модели основаны на ур-ниях магнитной гидродинамики .)

В массивных и компактных звёздах плотность К. п. может быть на неск. порядков выше, чем в центре нормальных звёзд. Так, в белых карликах плотность настолько велика, что электроны оказываются вырожденными (см. Вырожденный газ ).Ионизация вещества обеспечивается за счёт большой величины кинетич. энергии частиц, определяемой фер ми-энергией ; это же является причиной идеальности К. п. в белых карликах. Статич. равновесие обеспечивается фермиевским давлением электронов вырожденной плазмы. Ещё большие плотности вещества, возникающие в нейтронных звёздах, приводят к вырождению не только электронов, но и нуклонов. К нейтронным звёздам относятся пульсары - компактные звёзды, имеющие диаметры 20 км при массе 1 М . Пульсары характеризуются быстрым вращением (играющим важную роль в механич. равновесии звезды) и магн. полем дипольного типа (10 12 Гс на поверхности), причём магн. ось не обязательно совпадает с осью вращения. Пульсары обладают магнитосферой, заполненной релятивистской плазмой, к-рая является источником излучения эл--магн. волн.

Диапазон темп-р и плотностей К. п. огромен. На рис. схематически показано разнообразие видов плазмы и их примерное расположение на диаграмме температура-плотность. Как видно из диаграммы, последовательность в уменьшении плотности К. п. приблизительно такова: плазма звёзд, околопланетная плазма, плазма квазаров и галактич. ядер, межпланетная плазма, межзвёздная и межгалактич. плазма. За исключением плазмы ядер звёзд и ниж. слоев околопланетной плазмы, К. п. является бесстолкновительной. Поэтому она часто бывает термодинамически неравновесной, а ф-ции распределения составляющих её заряж. частиц по скоростям и энергиям далеки от максвелловских. В частности, они могут содержать пики, соответствующие отд. пучкам заряж. частиц, быть анизотропными, в особенности в магн. космич. полях, и т. п. Такая плазма "избавляется" от неравновесности не через столкновения, а наиб. быстрым путём - через возбуждение эл--магн. колебаний и волн (см. Бесстолкновительные ударные волны ).Это приводит к тому, что мощность излучения космич. объектов, содержащих бесстолкновительную плазму, намного превосходит мощность равновесного излучения, а спектр заметно отличается от планковского. Примером является излучение квазаров , к-рое и в радио- и в оптич. диапазоне имеет неравновесный характер. И, несмотря на неоднозначность теоретич. интерпретации наблюдаемого излучения, все теории указывают на важность роли потоков релятивистских электронов, распространяющихся на фоне основной плазмы.

Др. источник неравновесного радиоизлучения - радиогалактики ,к-рые по размерам значительно превосходят галактики, видимые в оптич. диапазоне. Здесь также важную роль играют релятивистские электроны, выбрасываемые из галактик и распространяющиеся на фоне окружающей галактики плазмы. Неравновесность магнитосферной плазмы, проявляющаяся также в наличии пучков заряж. частиц, приводит к километровому радиоизлучению Земли.

Классификация видов плазмы: ГР - плазма газового разряда; МГД - плазма в магни-тогидродинамичес-них генераторах; ТЯП-М - плазма в термоядерных магнитных ловушках; ТЯП-Л - плазма в условиях лазерного термоядерного синтеза: ЭГМ - электронный газ в металлах; ЭДП - электронно-дырочная плазма в полупроводниках; БК- вырожденный электронный газ в белых карликах; И - плазма ионосферы; СВ - плазма солнечного ветра; СК - плазма солнечной короны; С - плазма в центре Солнца; МП - плазма в магнитосферах пульсаров.

Неравновесные плазменные явления приводят также к тому, что плазма не только мощно излучает, но и становится турбулентной за счёт того, что определ. типы возбуждаемых волн и колебаний либо "задерживаются" в плазме долго либо вообще не могут "покинуть" плазму (напр., ленгмюровские колебания). Это позволяет найти путь для решения проблемы т. н. "обойдённых" элементов в теории происхождения элементов во Вселенной. Наиб. распространённая теория происхождения элементов предполагает, что из исходных протонов и нейтронов элементы образуются путём последоват. захвата нейтронов, а когда новый изотоп перегружен нейтронами, то в результате его радиоактивного распада с испусканием электрона и антинейтрино возникает новый элемент. Однако есть "обойдённые" элементы (напр., дейтерий, литий, бор и т. д.), образование к-рых нельзя объяснить захватом нейтронов; их происхождение, возможно, связано с ускорением заряж. частиц в областях с высокой степенью плазменной турбулентности и последующими ядерными реакциями ускоренных частиц.

К. п. удалённых объектов исследуется дистанционными спектральными методами с помощью оптич. телескопов, радиотелескопов, внеатмосферных спутниковых телескопов в рентгеновском и g-диапазонах излучения. С помощью приборов, установленных на ракетах, спутниках и космич. аппаратах, быстро расширяется диапазон прямых измерении параметров К. п. в пределах Солнечной системы. Эти методы включают в себя использование зондовых, волновых низко- и высокочастотных спектрометрич. измерений, измерений магн. и электрич. полей (см. Диагностика плазмы ).Так были обнаружены радиац. пояса Земли, солнечный ветер, бесстолкновительная ударная волна впереди магнитосферы Земли, хвост магнитосферы, километровое излучение Земли, магнитосферы планет от Меркурия до Сатурна и т. д.

Совр. космич. техника позволяет проводить т. н. активные эксперименты в космосе - активно воздействовать на К. п., в первую очередь околоземную, радиоизлучениями, пучками заряж. частиц, плазменными сгустками и т. п. Эти методы используются для диагностики, моделирования естеств. процессов в реальных условиях, инициирования естеств. явлений (напр., полярных сияний).

Типы К. п. в космологии. По cовp. представлениям, Вселенная возникла во время т. н. большого взрыва (big-bang). В период разлёта вещества (расширяющаяся Вселенная), помимо гравитации, определяющей разлёт, три остальных типа взаимодействия (сильное, слабое и эл--магнитное) вносят свой вклад в плазменные явления на разных стадиях разлёта. При чрезвычайно высоких темп-pax, характерных для ранних стадий разлёта, такие частицы, как, напр., W +- и Z 0 -бозоны, ответственные за слабые взаимодействия , были безмассовыми, как и фотоны (симметрия эл--магн. и слабых взаимодействий). Это означает, что слабое взаимодействие являлось дальнодействующим, в к-ром аналогом самосогласованному эл--магн. полю было самосогласованное Янга - Миллса поле . Т. о., вся лептонная компонента вещества находилась в состоянии плазмы. Учитывая имеющуюся в стандартной модели связь времени разлёта t и темп-ры термодинамически равновесного вещества Т : t(c )1/T 2 (темп-pa в МэВ), можно оценить время, в течение к-poro существовала такая лептонная плазма. При темп-pax Т , приближающихся к энергии покоя Z 0 -бозона Mz с 2 100 ГэВ (соответствующее время t 10 -10 с), происходит фазовый переход со спонтанным нарушением симметрии слабых и эл--магн. взаимодействий, приводящий к появлению масс у W +- и Z 0 -бозонов, после чего лишь заряженные лептоны взаимодействуют с помощью только одних дальнодействующих сил - электромагнитных.

Адронная (сильно взаимодействующая) компонента вещества при столь высоких темп-pax также находится в своеобразном плазменном состоянии, наз. кваркглюонной плазмой . Здесь взаимодействие между кварками осуществляется также безмассовыми глюонными полями. При плотностях горячей кварк-глюонной плазмы (п Т 3 )со ср. расстоянием между элементарными частицами 10 -13 см - радиус нуклона (при этом Т 100 МэВ) кварк-глюонная плазма является идеальной и может быть бесстолкновительной. При дальнейшем остывании Вселенной, когда за время t 10 -4 с темп-pa падает до T 100 МэВ (энергии покоя -мезонов), происходит новый фазовый переход: кварк-глюонная плазма - адронное вещество (характеризующееся короткодействием с радиусом взаимодействия 10 -13 см). Это вещество состоит из стабильных нуклонов и быстро распадающихся адронов. Общее состояние К. п. в последующий затем период определяется заряж. лептонной (в основном элект-ронно-позитронной) компонентой, т. к. во Вселенной сохраняется отношение полного барионного заряда к лептонному и само это отношение весьма мало (10 -9). В итоге при малых временах (t 1 с) К. п. является ультрарелятивистской и в основном электронно-позитронной. В момент времени t 1 с темп-pa электронно-позитронной плазмы падает до 1 МэВ и ниже, при этом начинается интенсивная аннигиляция электронно-позитронных пар, после чего К. п. медленно приближалась к совр. состоянию, мало меняясь по составу элементарных частиц.

Лит.: Пикельнер С. Б., Основы космической электродинамики, 2 изд., М., 1966; Акасофу С. И., Чепмен С., Солнечно-земная физика, пер. с англ., ч. 1-2, М., 1974-75; Арцимович Л. А., Сагдеев Р. 3., Физика плазмы для физиков, М., 1979.

В. Н. Ораевский, Р. 3. Сагдеев .

Cтраница 1


Космическая плазма может находиться и в спокойном, и в турбулентном состоянии. Последнее появляется тогда, когда плазма оказывается под сильным внешним нестационарным воздействием. В космосе такие процессы происходят часто.  

В космической плазме чаще всего ионами являются протоны.  

В космической плазме имеют место те или иные гидродинамические движения, энергия которых не мала. Вот они-то и обнадеживают как возможный источник усиления магнитных полей. Такой механизм обычно называют механизмом динамо. При этом говорят об усилении потому, что любая макроскопическая теория с определенной проводимостью симметрична относительно замены Е, Н - - - Е, - Н при сохранении поля скорости и сил, решение с Е - Н - 0 существует, для создания поля нужно ввести взаимодействие.  

В космической плазме частоты столкновений настолько малы, что более адекватным является бесстолкновительное кинетическое описание плазмы.  

Большинство теоретических исследований космической плазмы было посвящено изучению однородной плазмы. Однако наблюдения показывают, что в большинстве случаев космическая плазма сильно неоднородна. В ионосфере часто наблюдается мелкомасштабная структура, наиболее четко выраженная во время полярных сияний. Лучи полярного сияния часто очень тонки, и степень ионизации, а следовательно, и проводимость могут меняться на два или три порядка в пределах нескольких километров и менее. Как показало изучение распространения свистящих атмосфериков, магнитосфера, по-видимому, также имеет волокнистую структуру. Солнечная атмосфера также имеет лучистое строение. Ближе к поверхности Солнца наблюдаются протуберанцы, которые обычно имеют волокнистую структуру. Хромосферу иногда представляют в виде нитевидного сплетения небольших протуберанцев. Волокнистая структура часто бывает заметна в газовых туманностях. Итак, плазма средней плотности (а возможно, также и плазма низкой плотности), по-видимому, нередко сильно неоднородна и проявляет волокнистую структуру, элементы которой параллельны магнитному полю. Таким образом, представляется важным рассмотреть механизмы, которые могут создавать подобную структуру. Этому вопросу посвящен разд.  

Учитывая, что в космической плазме осуществляется очень широкий спектр всевозможных значений параметров - индукции магнитного поля В0, плотности я, температур Те, Th электрического поля Е, более подробно остановимся на эффектах, связанных с наличием магнитного поля, и на критериях применимости формул для ионно-звуковой неустойчивости и аномального сопротивления, обсуждаемых нами.  

Исследования аномального сопротивления в космической плазме, наоборот, дадут возможность изучить, как осуществляются эти крупномасштабные процессы во времени. Таким образом, можно ожидать, что магнитосферные исследования проблемы аномального сопротивления и двойных слоев приведут к более полному пониманию многих вопросов в физике турбулентной плазмы и, далее, к применению полученных результатов при решении проблем физики Солнца и в астрофизике.  

МГД течения характерны прежде всего для космической плазмы.  

Как показывает табл. 3.2, для космической плазмы условие (17) в большинстве случаев хорошо выполняется.  

Условие N k Nkl применительно к космической плазме кажется достаточно жестким. Ведь мощное элек тромагнитное излучение, для которого может потребоваться учет нелинейности, само турбулизирует плазму благодаря тем же распадным процессам. Если нелинейность существенно влияет на интенсивность электромагнитного излучения, то это означает одновременно и то, что значительная часть его энергии передается плазменным волнам [ см. (4.56) 1, а поскольку энергия одной плазменной волны много меньше энергии электромагнитной волны, то отсюда следует N kl Nk - Возможны, однако, случаи, когда плазменные волны интенсивно поглощаются, и поэтому уровень их энергии остается низким. Во всяком случае проблема нелинейного переноса электромагнитных волн в плазме, по-видимому, не может быть отделена от исследования возбуждения плазменной турбулентности и взаимодействия излучения с ней, в частности, рассеяния и увеличения частоты.  

Основное внимание в этой книге было уделено высокоэнергичной компоненте космической плазмы (КЛ), но краткое обсуждение свойств тепловой межпланетной плазмы также было дано в гл. Поэтому книга дает некоторое представление не только о КЛ, но также и о других динамических процессах в межпланетной среде. Автор надеется, что ему хотя бы в некоторой степени удалось отразить, а читатель сумел почувствовать красоту и многообразие многочисленных физических задач, возникающих перед исследователем в этой молодой и стремительно развивающейся области физики. Многие задачи уже решены, и общие представления выработаны Но немало проблем и еще больше частных задач ждет своего решения, причем их число нарастает по мере развития исследований.  

Только у альвеновских волн эффект излучения релятивистскими частицами в космической плазме может быть заметен.  

Имеется еще и другая возможность объяснить высокое эффективное аномальное сопротивление в космической плазме, а именно влиянием на эффективное сопротивление гидромагнитных флюктуации. В то же время представляет интерес попытаться не задавать подобные характеристики, а получить их исходя из данных измерений флюктуирующих электромагнитных полей на ИСЗ.  

Следует ожидать такую последовательность развития событий для токовых слоев в астрофизической или космической плазме, которые имеют размеры больше длины волны наиболее неустойчивой моды и большие числа Рейнольдса. Во-первых, токовый слой разрывается в линейном режиме на длине волны 4 5 / Ят наиболее быстро растущей моды. Затем первичное слияние объединяет соседние острова.  

В область применений магнитной гидродинамики входят очень разнообразные физические объекты-от жидких металлов до космической плазмы.