Server for Information Technologies Сервер поддерживается
Центром Информационных Технологий
(095) 932-9212, 932-9213, 939-0783
E-mail: info@citforum.ru
Сервер содержит море(!) аналитической информации CIT Forum CD-ROM

STAT(1G)

НАЗВАНИЕ
stat - статистическая обработка информации, полезная для графических команд

СИНТАКСИС

	имя_узла [опция ...] [файл ...]

ОПИСАНИЕ
Stat - набор команд (узлов), которые могут быть связаны в так называемую статистическую сеть при помощи sh(1). Все эти функции располагаются в каталоге /usr/bin/graf [см. graphics(1G)]. Единицей обмена данными между узлами сети служат вектора, то есть последовательности чисел. Ниже, в зависимости от контекста, они иногда называются также выборками, а составляющие их числа - наблюдениями. Числа представляются в форме:

	[знак](цифры)(.цифры)[e[знак]цифры]

и интерпретируются обычным образом. Скобки здесь не входят в представление числа, а используются для выделения полей. Никакое поле этого представления само по себе не является обязательным, но по крайней мере одно из полей, заключенных в круглые скобки, должно присутствовать. Любой символ, приходящий в узел и не являющийся частью числа, воспринимается как разделитель.

Узлы сети stat разбиваются на четыре класса:

Преобразователи
Осуществляют покомпонентную обработку векторов, переводя элементы входного вектора в элементы вы ходного вектора.

Операторы
Вычисляют различные статистики вектора (то есть скалярные или векторные функции векторного аргу мента).

Форматизаторы
Осуществляют преобразования форматов.

Генераторы
Порождают вектора по заданным правилам.

Ниже описывается синтаксис каждого из узлов stat. Опциям должен предшествовать символ -. Вообще говоря, опция задается в виде символа, за которым следует значение, например c5. Это интерпретируется как c := 5 (c присваивается значение 5). Для указания ожидаемых типов значений использованы следующие обозначения:

c Символ.
i Целое число.
f Число с плавающей точкой или целое число.
файл Имя файла.

цепочка
Цепочка символов (символы, интерпретируемые shell'ом, должны быть экранированы).

Опции без значений называются флагами.
В описаниях синтаксиса узлов специальные упоминания о файлах опущены, так как все узлы, кроме генераторов, предполагают их наличие и читают из этих файлов исходные данные. Если файл не указан, данные читаются со стандартного ввода.

Опция -c задает количество колонок при выводе. По умолчанию ее значение равно 5.

Преобразователи

abs [-ci] - абсолютная величина

af [-ci t v выражение] - арифметические действия t - поместить в результирующий файл заголовок, считанный со стандартного ввода, v - подробные пояснения, выражение - арифметическое выражение, в котором участвуют имена файлов, константы, знаки операций и круглые скобки (имена файлов не должны содержать символов /).

ceil [-ci] - округление до ближайшего целого с избытком

cusum [-ci] - нарастающий итог Сумма текущей и всех предшествующих компонент.

exp [-ci] - экспонента

floor [-ci] - округление до ближайшего целого с недостатком

gamma [-ci] - гамма-функция

list [-ci dцепочка] - перечисление элементов вектора
d - допустимые наряду с пробелом разделители числовых полей. Поле, в котором присутствуют не входящие в состав числа символы, игнорируется.

log [-ci bf] - логарифм
b - основание.

mod [-ci mf] - остаток от деления нацело
m - делитель.

pair [-ci Fфайл xi] - попарное (или более) об единение элементов
F - файл, содержащий основной вектор, x - размер группы: вывод группы из i последовательных элементов основного вектора чередуется с выводом одного элемента входного вектора.

power [-ci pf] - возведение в степень
p - показатель степени.

root [-ci rf] - извлечение корня
r - показатель радикала.

round [-ci pi si] - округление до указанного разряда
p - количество оставляемых позиций после десятичной точки, s - количество оставляемых значащих цифр.

sin [-ci] - синус

subset [-af bf ci Fфайл ii lf nl np pf si ti] - формирование подмножества
a - по превышению указываемого уровня, b - по (строгому) непревышению уровня, F - файл, содержащий номера элементов, i - шаг по номерам (используется совместно с s и t), l - по несовпадению с указываемым значением, nl - элементы с номерами, содержащимися в файле, не включаются в подмножество, np - в подмножество включаются только элементы с номерами, содержащимися в файле, p по совпадению с указываемым значением, s - начальный номер, t - конечный номер.

Операторы

bucket [-ai ci Fфайл hf if lf ni] - группировка предварительно отсортирова ных наблюдений по частичным интервалам a среднее количество наблюдений, приходящееся на частичный интервал, F файл, содержащий границы частичных интервалов, h верхняя граница полного интервала, i длина частичного интервала, l нижняя граница полного интервала, n количество частичных интервалов.

cor [-Fфайл] - коэффициент корреляции
F - файл, содержащий основной вектор (вычисляются коэффициенты корреляции основного вектора с каждым из входных). Все вектора должны иметь одинаковое количество элементов.

hilo [- h l o ox oy]- нахождение максимума и минимума
h - только максимум, l - только минимум, o - выдача результата в формате опций (например, "l-2.3,h5.1,"), ox - выдача результата в формате опций с подцепленным символом x (например, "xl-2.3,"), oy - то же с символом y (например, "yl-2.3,yh5.1,").

lreg [-Fфайл i o s] - линейная регрессия
F - файл, содержащий вектор значений "независимой" переменной (входной вектор должен содержать значения "зависимой" переменной; оба вектора должны иметь одинаковое количество элементов), i - вычисление только отрезка, отсекаемого на оси ординат, o - выдача результата в формате опций для узла siline (например, "i3,s1.2,"), s - вычисление только наклона линии регрессии.

point [-ff ni pf s] - квантиль эмпирической функции распределения
f - вероятность, определяющая квантиль, n - порядковый номер вариационного ряда выборки, p - вероятность в процентах, определяющая квантиль, s - выборка предварительно отсортирована (то есть совпадает со своим вариационным рядом).

mean [-ff ni pf] - среднее арифметическое, взятое с весом
f - вес в долях, n - вес в целых числах, p - вес в процентах.

prod - внутреннее произведение

qsort [-ci] - быстрая сортировка

rank - размерность вектора

total - общая сумма

var - несмещенная оценка дисперсии [с делителем (n-1)]

Форматизаторы

bar [-a b f g ri wi xf xa yf ya ylf yhf ] - построение столбцовой диаграмм
a - подавить вывод осей, b - утолщенные линии, f - подавить вывод рамки, g - подавить вывод масштабной сетки, r - размер области определения (то есть количество столбцов), w - ширина столбца в процентах, x - начало по оси x, xa - подавить вывод метки оси x, y - начало по оси y, ya - подавить вывод метки оси y, yl - нижняя граница по оси y, yh - верхняя граница по оси y. Данные округляются до целых.

hist [-a b f g ri xf xa yf ya ylf yhf ] - построение гистограммы
a - подавить вывод осей, b - утолщенные линии, f - подавить вывод рамки, g - подавить вывод масштабной сетки, r - размер области определения (то есть количество столбцов), x - начало по оси x, xa - подавить вывод метки оси x, y - начало по оси y, ya - подавить вывод метки оси y, yl - нижняя граница по оси y, yh - верхняя граница по оси y.

label [-b c Fфайл h p ri x xu y yr] - маркировка осей в файле GPS-формата
b ввод данных столбцовой диаграммы, c сохранить большие/малые буквы в названиях (по умолчанию осуществляется переход к большим), F маркируемый файл, h ввод данных гистограммы, p ввод данных графика, r поворот осей, x ось x, xu ось x вверху, y ось y, yr ось y справа.

pie [-b o p pni ppi ri v xi yi] - построение круговой диаграммы
b - утолщенные линии, o - значения отображаются вне круга, p - значения заданы в процентах, pn - значения вычисляются как процент от заданной величины, pp - в качестве значения отображать процент, r - количество секторов, v - значения не отображать, x - x-координата центра, y - y-координата центра.

В отличие от других узлов, вводимые данные представляют собой строки вида:

[< i e f cc >] значение [метка]
i - игнорировать (не изображать) сектор, e - выдвинуть сектор, f - сплошная закраска сектора, c - цвет сектора c=(b - черный, r - красный, g - зеленый, u - синий).

plot [-a b cцепочка d f Fфайл g m ri xf xa xif xhf xlf xni xt yf ya yif yh - построение графика
a подавить вывод осей, b утолщенные линии, c символы, используемые при построении графика, d разрывный график, f подавить вывод рамки, F файл, содержащий x-вектор, g подавить вывод масштабной сетки, m маркировать точки, r количество точек, x начало по оси x, xa подавить вывод метки оси x, xi длина интервала по оси x, xh верхняя граница по оси x, xl нижняя граница по оси x, xn число отсчетов по оси x, xt подавить вывод названия оси x, y начало по оси y, ya подавить вывод метки оси y, yi длина интервала по оси y, yh верхняя граница по оси y, yl нижняя граница по оси y, yn число отсчетов по оси y, yt подавить вывод названия оси y.

title [-b c lцепочка vцепочка uцепочка] - внесение заголовка в файл, содержащий вектор, или в файл GPS-формата
b - жирный шрифт заголовка, c - сохранить большие/малые буквы в заголовке (по умолчанию осуществляется переход к большим), l - заголовок внизу, u - заголовок вверху, v - заголовок вектора.

Генераторы

gas [-ci if ni sf tf] - генерация арифметической прогрессии
i - разность, n - количество элементов, s - начальное значение, t - верхняя граница.

prime [-ci hi li ni] - генерация простых чисел
h - верхняя граница, l - нижняя граница, n - количество элементов.

rand [-ci hf lf mf ni si] - генерация случайной последовательности
h - верхняя граница, l - нижняя граница, m - множитель, n - количество элементов, s - инициализирующее значение.

siline [-ci if ni sf ] - генерация ординат прямой по заданному наклону и отрезку, отсекаемому на оси ординат
i - отрезок, отсекаемый на оси ординат, n - количество целых неотрицательных значений абсциссы, для которых вычисляются ординаты, s - наклон прямой.

СМ. ТАКЖЕ
graphics(1G).
gps(4) в Справочнике программиста.

ОГРАНИЧЕНИЯ
Некоторые узлы имеют ограничение на размер входного вектора.

СЮРПРИЗЫ
Узлы abs, exp, gamma, log, power, root, sin работают неправильно.

Узел af с опцией -t работает в соответствии с описанием только в том случае, когда стандартный ввод осуществляется из файла (вектора), куда заголовок был помещен командой title -v'...'. Опция -v никакого влияния на работу узла af не оказывает.

Узлы ceil, floor фактически осуществляют вычисление дробной части.

Узел mod фактически осуществляет вычисление функции

  f(x) = (x mod m) / m.
Узел cor фактически осуществляет вычисление суммы
  (x[i]-x) * (y[i]-y)
по i, то есть полуфабрикат коэффициента ковариации.

Узел mean работает нормально только в отсутствие опций.

Узел point работает нормально только с опцией -n.

Узел prod фактически осуществляет вычисление произведения всех компонент вектора.

Узел prime фактически генерирует последовательные нечетные числа.

Comments: info@citmgu.ru
Designed by Andrey Novikov
Copyright © CIT
Обновлено: 13.03.2015