Лекції з системного аналізу

1.doc (11 стор.)
Оригінал


1   2   3   4   5   6   7   8   9   10   11

2. Основні поняття математичної статистики

2.1 Випадкові події та величини, їх основні характеристики


Як вже говорилося, при аналізі великих систем наповнювачем каналів зв'язку між елементами, підсистемами і системи в цілому можуть бути:

 продукція, тобто реальні, фізично відчутні предмети з наперед заданим способом їх кількісного і якісного опису;

 гроші, з єдиним способом опису - сумою;

 інформація, у вигляді повідомлень про події в системі і значних описують її поведінку величин.

Почнемо з того, що звернемо увагу на тісний (сістемную!) зв'язок показників продукції і грошей з інформацією про цих показниках. Якщо розглядати деяку фізичну величину, скажімо - кількість проданих за день зразків продукції, то відомості про цю величиною після продажу можуть бути отримані без проблем і досить точно або достовірно. Але, вже повинно бути ясно, що при системному аналізі нас куди більше цікавить майбутнє - а скільки цієї продукції буде продано за день? Це питання зовсім не пусте - наша мета управляти, а за образним висловом "управляти - значить передбачати".

Отже, без попередньої інформації, знань про кількісні показники в системі нам не обійтися. Величини, які можуть приймати різні значення в залежності від зовнішніх по відношенню до них умов, прийнято називати випадковими (стохастичності по природі). Так, наприклад: стать зустрінутого нами людини може бути жіночим чи чоловічим (дискретна випадкова величина); його зростання також може бути різним, але це вже неперервна випадкова величина - з тією чи іншою кількістю можливих значень (залежно від одиниці виміру).

Для випадкових величин (далі - СВ) доводиться використовувати особливі, статистичні методи їх опису. В залежності від типу самої СВ - дискретна або безперервна це робиться по різному.

Дискретне опис полягає в тому, що вказуються всі можливі значення даної величини (наприклад - 7 кольорів звичайного спектру) і для кожної з них вказується ймовірність або частота спостережень іменного цього значення при нескінченно великому числі всіх спостережень.


Можна довести (і це давно зроблено), що при збільшенні числа спостережень в певних умовах за значеннями деякої дискретної величини частота повторень даного значення буде все більше наближатися до деякого фіксованому значенню - яке і є ймовірність цього значення.

До поняття ймовірності значення дискретної СВ можна підійти і іншим шляхом - через випадкові події. Це найбільш просте поняття в теорії ймовірностей і математичній статистиці - подія з імовірністю 0.5 або 50% в 50 випадках зі 100 може відбутися або не відбутися, якщо ж його ймовірність більш 0.5 - воно частіше відбувається, чому не відбувається. Події з ймовірністю 1 називають достовірними, а з імовірністю 0 - неможливими.

Звідси просте правило: для випадкової події X ймовірності P (X) (подія відбувається) і P (X) (подія не відбувається), в сумі для простого події дають 1.

Якщо ми спостерігаємо за складною подією - наприклад, випаданням чисел 1 .. 6 на верхній грані гральної кістки, то можна вважати, що така подія має безліч фіналів і для кожного з них ймовірність становить 1/6 при симетрії кістки.

Якщо ж кістка несиметрична, то ймовірності окремих чисел будуть різними, але сума їх дорівнює 1.

Варто тільки розглядати підсумок кидання кістки як дискретну випадкову величину і ми прийдемо до поняття розподілу ймовірностей такої величини.

Нехай в результаті досить великого числа спостережень за грою за допомогою однієї і тієї ж кістки ми отримали наступні дані:

Таблиця 2.1

Грані

1

2

3

4

5

6

Разом

Спостереження

140

80

200

400

100

80

1000

Подібну таблицю спостережень за СВ часто називають вибірковим розподілом, а відповідну їй картинку (діаграму) - гістограмою.


Рис. 2.1



Яку ж інформацію несе така табличка або відповідна їй гістограма?

Перш за все, всю - так як іноді і таких даних про значеннях випадкової величини немає і їх доводиться або видобувати (експеримент, моделювання), або вважати результати такого складного події рівноімовірними - по на будь-який з фіналів.

З іншого боку - дуже мало, особливо в цифровому, чисельному описі СВ. Як, наприклад, відповісти на питання: - а скільки в середньому ми виграємо за одне кидання кістки, якщо виграш відповідає числу, що випав на межі?

Неважко порахувати:

1 • 0.140 +2 • 0.080 +3 • 0.200 +4 • 0.400 +5 • 0.100 +6 • 0.080 = 3.48

Те, що ми обчислили, називається середнім значенням випадкової величини, якщо нас цікавить минуле.

Якщо ж ми поставимо питання інакше - оцінити за цими даними наш майбутній виграш, то відповідь 3.48 прийнято називати математичним очікуванням випадкової величини, яке в загальному випадку визначається як

Mx =  X iP (X i); {2 - 1}

де P (X i) - ймовірність того, що X прийме своє i-е чергове значення.

Таким чином, математичне сподівання випадкової величини (як дискретної, так і безперервної) - це те, до чого прагне її середнє значення при достатньо великій кількості спостережень.

Звертаючись до нашого прикладу, можна помітити, що кістка несиметрична, в іншому випадку ймовірності становили б по 1/6 кожна, а середнє і математичне очікування склало б 3.5.

Тому доречний наступне питання - а яка ступінь асиметрії кістки - як її оцінити за підсумками спостережень?

Для цієї мети використовується спеціальна величина - міра розсіювання - так само як ми "усереднює" допустимі значення СВ, можна усереднити її відхилення від середнього. Але так як різниці (X i - Mx) завжди будуть компенсувати один одного, то доводиться усереднювати не відхилення від середнього, а квадрати цих відхилень. Величину

{2 - 2}

прийнято називати дисперсією випадкової величини X.

Обчислення дисперсії набагато спрощується, якщо скористатися виразом

{2 - 3}

тобто обчислювати дисперсію випадкової величини через усереднену різницю квадратів її значень і квадрат її середнього значення.

Виконаємо таке обчислення для випадкової величини з розподілом рис. 1.

Таблиця 2.2

Грані (X)

1

2

3

4

5

6

Разом

X 2

1

4

9

16

25

36




Pi

0.140

0.080

0.200

0.400

0.100

0.080

1.00

Pi • X 2 • 1000

140

320

1800

6400

2500

2880

14040

Таким чином, дисперсія складе 14.04 - (3.48) 2 = 1.930.

Зауважимо, що розмірність дисперсії не збігається з розмірністю самої СВ і це не дозволяє оцінити величину розкиду. Тому найчастіше замість дисперсії використовується квадратний корінь з її значення - т. зв. Середньоквадратичне відхилення або відхилення від середнього значення:

{2 - 4}

становить у нашому випадку = 1.389. Багато це чи мало?

Зміркуємо, що в разі спостереження тільки одного з можливих значень (розкиду немає) середнє було б одно саме цим значенням, а дисперсія склала б 0. І навпаки - якщо б всі значення спостерігалися однаково часто (були б рівноімовірними), то середнє значення склало б (1 +2 +3 +4 +5 +6) / 6 = 3.500; усереднений квадрат відхилення - (1 + 4 + 9 + 16 + 25 + 36) / 6 = 15.167; а дисперсія 15.167-12.25 = 2.917.

Таким чином, найбільша розсіювання значень СВ має місце при її рівноймовірно або рівномірному розподілі.

Відзначимо, що значення Mx і S X є розмірними і їх абсолютні значення мало що говорять. Тому часто для грубої оцінки "випадковості" даної СВ використовують т. н. Коефіцієнт варіації або відношення кореня квадратного з дисперсії до величини математичного очікування:

V x = S X / M X. {2 - 5}

У нашому прикладі ця величина складе 1.389/3.48 = 0.399.

Отже, запам'ятаємо, що невипадкова, детермінована величина має математичне сподівання рівне їй самій, нульову дисперсію і нульовий коефіцієнт варіації, в той час як рівномірно розподілене СВ має максимальну дисперсію і максимальний коефіцієнт варіації.

У ряді ситуацій доводиться мати справу з безперервно розподіленими СВ - вагами, відстанями і т. п. Для них ідея оцінки середнього значення (математичного очікування) та міри розсіювання (дисперсії) залишається тією ж, що і для дискретних СВ. Доводиться тільки замість відповідних сум обчислювати інтеграли. Друга відмінність - для безперервної СВ питання про те яка ймовірність прийняття нею конкретного значення зазвичай не має сенсу - як перевірити, що вага товару становить точно 242 кг - не більше і не менше?

Для всіх СВ - дискретних і безперервно розподілених, має дуже великий сенс питання про діапазон значень. У самому справі, іноді знання ймовірності тієї події, що випадкова величина не перевершить заданий рубіж, є єдиним способом використовувати наявну інформацію для системного аналізу і системного підходу до управління. Правило визначення ймовірності попадання в діапазон дуже просто - треба підсумувати імовірності окремих дискретних значень діапазону або проінтегрувати криву розподілу на цьому діапазоні.

2.2 Взаємозв'язки випадкових подій


Повернемося тепер до питання про випадкових подіях. Тут методично зручніше розглядати спочатку прості події (може відбутися або не відбутися). Ймовірність події X будемо позначати P (X) і мати на увазі, що ймовірність того, що подія не відбудеться, становить

P (X) = 1 - P (X). {2 - 6}

Найважливіше при розгляді декількох випадкових подій (тим більше в складних системах з розвиненими зв'язками між елементами і підсистемами) - це розуміння способу визначення ймовірності одночасного настання кількох подій або, коротше, - поєднання подій.

Розглянемо найпростіший приклад двох подій X і Y, ймовірності яких складають P (X) і P (Y). Тут важливий лише одне питання - це події незалежні або, навпаки взаємозалежні і тоді яка міра зв'язку між ними? Спробуємо розібратися в цьому питанні на підставі здорового глузду.

Оцінимо спочатку ймовірність одночасного настання двох незалежних подій. Елементарні міркування приведуть нас до висновку: якщо події незалежні, то при 80%-й імовірності X і 20%-й імовірності Y одночасне їх наступ має ймовірність всього лише 0.8 • 0.2 = 0.16 або 16% .

Отже - ймовірність настання двох незалежних подій визначається добутком їх ймовірностей:

P (XY) = P (X) P (Y). {2 - 7}

Перейдемо тепер до подій залежним. Будемо називати ймовірність події X за умови, що подія Y вже відбулося умовної ймовірністю P (X / Y), вважаючи при цьому P (X) безумовної або повної ймовірністю. Настільки ж прості міркування приводять до так званої формулою Байєса

P (X / Y) P (Y) = P (Y / X) P (X) {2 - 8}

де ліворуч і праворуч записано одне і те ж - ймовірності одночасного настання двох "залежних" або корельованих подій.

Доповнимо цю формулу загальним виразом безумовної ймовірності події X:

P (X) = P (X / Y) P (Y) + P (X / Y) P (Y), {2 - 9}

що означає, що дана подія X може відбутися або після того як подія Y відбулося, або після того, як воно не відбулося (Y) - третього не дано!

Формули Байєса або т. зв. Байєсовський підхід до оцінки імовірнісних зв'язків для простих подій і дискретно розподілених СВ відіграють вирішальну роль у теорії прийняття рішень в умовах невизначеності наслідків цих рішень або в умовах протидії з боку природи, або інших великих систем (конкуренції). У цих умовах ключовою є стратегія управління, заснована на прогнозі т. н. апостеріорної (послеопитной) ймовірності події

P (X / Y) . {2 - 10}

Перш за все, ще раз зазначимо взаємну зв'язок подій X і Y - якщо одне не залежить від іншого, то дана формула звертається в тривіальне тотожність. До речі, ця обставина використовується при вирішенні задач оцінки тісноти зв'язків - кореляційному аналізі. Якщо ж взаємозв'язок подій має місце, то формула Байєса дозволяє вести управління шляхом оцінки ймовірності досягнення певної мети на основі спостережень над процесом функціонування системи - шляхом перерахунку варіантів стратегій з урахуванням змінених уявлень, тобто нових значень ймовірностей.

Справа в тому, що будь-яка стратегія управління будуватиметься на базі певних уявлень про ймовірності подій в системі - і на перших кроках ці ймовірності будуть узяті "з голови" або в кращому випадку з досвіду управління іншими системами. Але в міру "життя" системи можна випускати з уваги можливість "корекції" управління - використання всього накапливаемого досвіду.

2.3 Схеми випадкових подій і закони розподілів випадкових величин


Велику роль в теорії та практиці системного аналізу відіграють деякі стандартні розподілу неперервних та дискретних СВ.

Ці розподілу іноді називають "теоретичними", оскільки для них розроблені методи розрахунку всіх показників розподілу, зафіксовані зв'язки між ними, побудовані алгоритми розрахунку і т. п.

Таких, класичних законів розподілів досить багато, хоча "штат" їх за останні 30 .. 50 років практично не поповнився. Необхідність знайомства з цими розподілами для фахівців вашого профілю пояснюється тим, що всі вони відповідають деяким "теоретичним" схемами випадкових (здебільшого - елементарних) подій.

Як уже зазначалося, наявність великих масивів взаємозалежних подій і достаток випадкових величин в системах економіки призводить до труднощів апріорної оцінки законів розподілів цих подій або величин. Нехай, наприклад, ми якимось чином встановили математичне очікування попиту деякого товару. Але цього мало - треба хоча б оцінити ступінь коливання цього попиту, відповісти на запитання - а яка вірогідність того, що він буде лежати в таких-то межах? От якби встановити факт належності даної випадкової величини до такого класичного розподілу як т. зв. Нормальне, то тоді завдання оцінки діапазону, довіри до нього (довірчих інтервалів) була б вирішена без всяких проблем.

Доведено, наприклад, що з імовірністю більше 95% випадкова величина X з нормальним законом розподілу лежить в діапазоні - математичне очікування Mx плюс / мінус три середньоквадратичних відхилення S X.

Так от - вся справа в тому до якої з схем випадкових подій класичного зразка найближче схема функціонування елементів вашої великої системи. Простий приклад - треба оцінити показники оплати за послуги надання часу на міжміські переговори - наприклад, знайти ймовірність того, що за 1 хвилину здійснюється рівно N переговорів, якщо заздалегідь відомо середнє число вступників у хвилину замовлень. Виявляється, що схема таких випадкових подій прекрасно вкладається в т. н. Розподіл Пуассона для дискретних випадкових величин. Цьому розподілу підпорядковані майже всі дискретні величини, пов'язані з так званими "рідкісними" подіями.

Далеко не завжди математична оболонка класичного закону розподілу досить проста. Навпаки - найчастіше це складний математичний апарат зі своїми, специфічними прийомами. Але справа не в цьому, тим більше при "повальної" комп'ютеризації всіх областей діяльності людини. Зрозуміло, немає необхідності знати в деталях властивості всіх або хоч якоїсь частини класичних розподілів - достатньо мати на увазі саму можливість скористатися ними.

З особистого досвіду - дуже давно, в до_компьютерную еру авторові цих рядків вдалося запропонувати метод оцінки ступеня надійності енергопостачання, знайти по суті справи ігровий метод прийняття рішення про необхідність витрат на резервування ліній електропередач в умовах невизначеності - ігри з природою.

Таким чином, при системному підході до вирішення тієї чи іншої задачі управління (в тому числі і економічного) треба дуже зважено поставитися до вибору елементів системи або окремих системних операцій. Не завжди "укрупнення показників" забезпечить логічну стрункість структури системи - треба розуміти, що помітити близькість схеми подій в даній системі до схеми класичної найчастіше вдається на самому "елементарному" рівні системного аналізу.

Завершуючи питання про розподіл випадкових величин звернемо увагу на ще одну важливу обставину: навіть якщо нам достатньо одного єдиного показника - математичного очікування даної випадкової величини, то і в цьому випадку виникає питання про надійність даних про це показника.

У самому справі, нехай нам дано т. н. Вибіркове розподіл випадкової величини X (наприклад - щоденної виручки в $) у вигляді 100 спостережень за цією величиною. Нехай ми розрахували середнє Mx і воно склало $ 125 при коливаннях від $ 50 до $ 200. Попутно ми знайшли S X, рівне $ 5. Тепер доречне запитання: а наскільки правдоподібним буде твердження про те, що в наступні дні виручка складе точно $ 125? Або буде лежати в інтервалі $ 120 .. $ 130? Або виявиться більш деякої суми - наприклад, $ 90?

Питання такого типу надзвичайно гострі - якщо це всього лише елемент деякої економічної системи (один з багатьох), то висновки на фініші системного аналізу, їх достовірність, звичайно ж, залежать від відповідей на такі питання.

Що ж говорить теорія, відповідаючи на ці питання? З одного боку дуже багато, але в деяких випадках - майже нічого. Так, якщо у вас є впевненість в тому, що "теоретичне" розподіл даної випадкової величини відноситься до деякого класичному (тобто повністю описаного в теорії) типу, то можна отримати досить багато корисного.

 За допомогою теорії можна знайти довірчі інтервали для даної випадкової величини. Якщо, наприклад, вже доведено (точніше - прийнята гіпотеза) про нормальний розподіл, то знаючи середньоквадратичне відхилення можна з упевненістю в 5% вважати, що опиниться поза діапазону (M x - 3 S x)...... (M x 3 S x) або в нашому прикладі виручка з імовірністю 0.05 буде <$ 90 або> $ 140. Треба змиритися зі своєрідністю теоретичного висновку - стверджується не той факт, що виручка складе від 90 до 140 (з імовірністю 95%), а тільки те, що сказано вище.

 Якщо у нас немає теоретичних підстав прийняти яке або класичне розподіл в якості підходящого для нашої СВ, то і тут теорія надасть нам послугу - дозволить перевірити гіпотезу про такий розподіл на підставі наявних у нас даних. Правда - вичерпної відповіді "Так" або "Ні" чекати нічого. Можна лише отримати ймовірність помилитися, відкинувши вірну гіпотезу (помилка 1 роду) або ймовірність помилитися прийнявши хибну (помилка 2 роду).

 Навіть такі "обтічні" теоретичні висновки в сильному ступені залежать від обсягу вибірки (кількості спостережень), а також від "чистоти експерименту" - умов його проведення.

2.4 Методи непараметричної статистики


Використання класичних розподілів випадкових величин зазвичай називають "параметричної статистикою" - ми робимо припущення про те, що цікавить нас СВ (дискретна або безперервна) має ймовірності, обчислювані за деякими формулами або алгоритмам. Однак не завжди у нас є підстави для цього. Причин тому частіше всього дві:

 деякі випадкові величини просто не мають кількісного опису, обгрунтованих одиниць виміру (рівень знань, якість продукції тощо);

 спостереження над величинами можливі, але їх кількість занадто мало для перевірки припущення (гіпотези) про тип розподілу.

В даний час у прикладній статистиці все більшою популярністю користуються методи т. н. Непараметричної статистики - коли питання про приналежність розподілу ймовірностей даної величини до того чи іншого класу взагалі не піднімається, але звичайно ж - задача оцінки самої СВ, отримання інформації про неї, залишається .

Одним з основних понять непараметричної статистики є поняття ШКАЛИ або процедури шкалювання значень СВ. За своїм змістом процедура шкалювання суть вирішення питання про "одиницях виміру" СВ. Прийнято використовувати чотири види шкал.

Nom. Першою з них розглянемо Номінальна шкала - застосовується до тих величин, які не мають природної одиниці виміру. Якщо деяка величина може приймати на своїй номінальній шкалі значення X, Y або Z, то справедливими вважаються тільки вираження типу: (X # Y), (X # Z), (X = Z), а вирази типу (X> Y), (X <Z), (X + Z) не мають ніякого сенсу. Приклади СВ, до яких застосовні тільки номінальні шкали - стать, колір, марка автомобіля і т. п.

Ord. Другий спосіб шкалювання - використання поряд-кових шкал. Вони незамінні для СВ, що не мають природних одиниць виміру, але дозволяють застосовувати поняття переваги одного значення іншому. Типовий приклад: оцінки знань (навіть при нечислової описі), службові рівні і т. п.; для таких величин дозволені не тільки стосунки рівності (= або #), але і знаки переваги (> або <). Іноді говорять про ранги значень таких величин.

Int & Rel. Ще два способи шкалювання використовуються для СВ, мають натуральні розмірності - це інтервальний і ВІДНОСНА шкала. Для таких величин, крім відносин рівності і переваги, припустимі операції порівняння - тобто всі чотири дії арифметики. Головна особливість таких шкал полягає в тому, що різниця двох значень на шкалі (36 і 12) має один сенс для будь-якого місця шкали (28 і 4). Різниця між інтервального шкалою і відносної - тільки в понятті нуля - на інтервального шкалою 0 Кг ваги означає відсутність ваги, а на відносній шкалі температур 0 градусів не означає відсутність теплоти - оскільки можливі температури нижче 0 градусів (за Цельсієм).

Можна тепер помітити ще одна перевага, яку ми отримуємо при використанні методів непараметричної статистики - якщо ми стикаємося з випадковою величиною безперервної природи, то використання інтервальної або відносної шкали дозволить нам мати справу не з випадковими величинами, а з випадковими подіями - типу "вірогідність того, що вага продукції знаходиться в інтервалі 17 Кг ". Тому можна запропонувати єдиний підхід до опису всіх показників функціонування складної системи - опис на рівні простих випадкових подій (з ймовірністю P (X) може відбутися подія X). При тому під подією доведеться розуміти те, що випадкова величина займе одне з допустимих для неї положень на шкалі Nom, Ord, Int або Rel.

Звичайно - такий, "мікроскопічний" підхід різко збільшує обсяг інформації, необхідної для системного аналізу. Частково цей недолік пом'якшується при використанні комп'ютерних методів системного аналізу, але більш важливо інше - перевага на початкових етапах аналізу, коли вирішуються питання дезінтеграції великої системи (виділення окремих її елементів) і подальшої її інтеграції для розробки стратегії управління системою.

Не буде великим перебільшенням вважати, що методи непараметричної статистики - найбільш потужний засіб для вирішення завдань системного аналізу в багатьох областях діяльності людини і, зокрема, в економіці.

2.5 Кореляція випадкових величин


Пряме токування терміна кореляція - стохастична, ймовірна, можливий зв'язок між двома (парна) або кількома (множинна) випадковими величинами.

Вище йшлося про те, що якщо для двох СВ (X і Y) має місце рівність P (XY) = P (X) P (Y), то величини X і Y вважаються незалежними. Ну, а якщо це не так!?

Адже завжди важливе питання - а як сильно залежать одна СВ від іншої? І справа в не властивому людям прагненні аналізувати небудь обов'язково в числовому вимірі. Вже зрозуміло, що системний аналіз означає безперервні ви числі ения, що використання комп'ютера змушує нас працювати з числами, а не поняттями.

Для числової оцінки можливого зв'язку між двома випадковими величинами: Y (з середнім M y і середньоквадратичним відхиленням S y) і - X (з середнім M x і середньоквадратичним відхиленням S x) прийнято використовувати так званий коефіцієнт кореляції

R xy = . {2 - 11}


Цей коефіцієнт може приймати значення від -1 до +1 - залежно від тісноти зв'язку між даними випадковими величинами.

Якщо коефіцієнт кореляції дорівнює нулю, то X і Y називають некоррелірованнимі. Вважати їх незалежними звичайно немає підстав - виявляється, що існують такі, як правило - нелінійні зв'язки величин, при яких R xy = 0, хоча величини залежать один від одного. Зворотне завжди вірно - якщо величини незалежні, то R xy = 0. Але, якщо модуль R xy = 1, то є всі підстави припускати наявність лінійного зв'язку між Y і X. Саме тому часто говорять про лінійної кореляції при використанні такого способу оцінки зв'язку між СВ.

Відзначимо ще один спосіб оцінки кореляційного зв'язку двох випадкових величин - якщо просумувати твори відхилень кожної з них від свого середнього значення, то отриману величину -

З xy =  (X - M x)(Y - M y)

або ковариацию величин X і Y відрізняє від коефіцієнта кореляції два показники: по-перше, усереднення (поділ на число спостережень або пар X, Y) і, по-друге, нормування шляхом ділення на відповідні середньоквадратичні відхилення.

Така оцінка зв'язків між випадковими величинами у складній системі є одним з початкових етапів системного аналізу, тому вже тут у всій гостроті постає питання про довіру до висновку про наявність чи відсутність зв'язків між двома СВ.

У сучасних методах системного аналізу зазвичай надходять так. По знайденому значенню R обчислюють допоміжну величину:

W = 0.5 Ln [(1 + R) / (1-R)] {2 - 12}

і питання про довіру до коефіцієнта кореляції зводять до довірчим інтервалам для випадкової величини W, які визначаються стандартними таблицями або формулами.

В окремих випадках системного аналізу доводиться вирішувати питання про зв'язки декількох (більш 2) випадкових величин або питання про множинної кореляції.

Нехай X, Y і Z - випадкові величини, за спостереженнями над якими ми встановили їх середні M x, M y, Mz і середньоквадратичні відхилення S x, S y, S z.

Тоді можна знайти парні коефіцієнти кореляції R xy, R xz, R yz за наведеною вище формулою. Але цього явно недостатньо - адже ми на кожному з трьох етапів попросту забували про наявності третьої випадкової величини! Тому у випадках множинного кореляційного аналізу іноді потрібно відшукувати т. н. Приватні коефіцієнти кореляції - наприклад, оцінка виляння Z на зв'язок між X і Y проводиться за допомогою коефіцієнта

R xy.z = {2 - 13}

І, нарешті, можна поставити питання - а яка зв'язок між даною СВ і сукупністю інших? Відповідь на такі питання дають коефіцієнти множинної кореляції R x.yz, R y.zx, R z.xy, формули для обчислення яких побудовані за тими ж принципами - обліку зв'язку однієї з величин з усіма іншими в сукупності.

На складності обчислень всіх описаних показників кореляційних зв'язків можна не звертати особливої ​​уваги - програми для їх розрахунку досить прості і є в готовому вигляді в багатьох ППП сучасних комп'ютерів.

Достатньо зрозуміти головне - якщо при формальному описі елемента складної системи, сукупності таких елементів у вигляді підсистеми або, нарешті, системи в цілому, ми розглядаємо зв'язки між окремими її частинами, - то ступінь тісноти зв'язку з цим у вигляді впливу однієї СВ на іншу можна і потрібно оцінювати на рівні кореляції.


На закінчення зазначимо ще одне - у всіх випадках системного аналізу на кореляційному рівні обидві випадкові величини при парній кореляції або все при множинній вважаються "рівноправними" - тобто мова йде про взаємний вплив СВ один на одного.

Так буває далеко не завжди - дуже часто питання про зв'язки Y і X ставиться у іншій площині - одна з величин є залежною (функцією) від іншої (аргументу).


2.6 Лінійна регресія


У тих випадках, коли з природи процесів в системі або з даних спостережень над нею випливає висновок про нормальному законі розподілу двох СВ - Y і X, з яких одна є незалежною, тобто Y є функцією X, то виникає спокуса визначити таку залежність "формульно", аналітично.

У разі успіху нам буде набагато простіше вести системний аналіз - особливо для елементів системи типу "вхід-вихід". Звичайно, найбільш привабливою є перспектива лінійної залежності типу Y = a + bX.

Подібна задача носить назву задачі регресійного аналізу і припускає наступний спосіб вирішення.

Висувається наступна гіпотеза:

H 0: випадкова величина Y при фіксованому значенні величини X розподілена нормально з математичним очікуванням

M y = a + b  X і дисперсією D y, не залежної від X. {2 - 14}

При наявності результатів спостережень над парами X i і Y i попередньо обчислюються середні значення M y і M x, а потім проводиться оцінка коефіцієнта b у вигляді

b = = R xy {2 - 15}

що випливає з визначення коефіцієнта кореляції {2 - 11}.

Після цього обчислюється оцінка для a у вигляді

a = M y - b M X {2 - 16}

і проводиться перевірка значущості отриманих результатів. Таким чином, регресійний аналіз є потужним, хоча й далеко не завжди допустимим розширенням кореляційного аналізу, вирішуючи все ту ж задачу оцінки зв'язків у складній системі.

2.7 Елементи теорії статистичних рішень


Що таке - статистичне рішення? В якості найпростішого прикладу розглянемо ситуацію, в якій вам пропонують зіграти в таку гру:

 вам заплатять 2 долари, якщо підкинута монета впаде вгору гербом;

 ви заплатите 1 долар, якщо вона впаде гербом вниз.

Швидше за все, ви погодитеся зіграти, хоча розумієте ступінь ризику. Ви усвідомлюєте, "знаєте" про равновероятности появи герба і "обчислюєте" свій виграш 0.5  1 - 0.5  1 = + $ 0.5.

Ускладнимо гру - ви бачите, що монета кілька вигнута і можливо буде падати частіше однієї зі сторін. Тепер рішення грати або не грати як і раніше залежить від імовірності виграшу, яка не може бути заздалегідь (з латині - apriori) прийнята рівною 0.5.

Людина, знайомий зі статистикою, спробує оцінити цю ймовірність за допомогою дослідів, якщо звичайно вони можливі і коштують не дуже дорого. Негайно виникає питання - скільки таких бросаний вам буде достатньо?

Нехай з вас прочитується 5 центів за одне експериментальне кидання, а ставки в грі складають $ 2000 проти $ 1000. Швидше за все, ви погодитеся зіграти, заплативши порівняно невелику суму за 100 .. 200 експериментальних кидків. Ви, напевно, будете вести підрахунок вдалих падінь і, якщо їх число складе 20 з 100, припиніть експеримент і зіграєте на ставку $ 2000 проти $ 1000, так як очікуваний виграш оцінюється в 0.8  2000 + 0.2  1000 - 100  0.05 = $ 1795.

У наведених прикладах головним для прийняття рішення була ймовірність успішного результату падіння монетки. У першому випадку - апріорна ймовірність, а в другому - апостеріорна. Таку інформацію прийнято називати даними про стан природи.

Наведені приклади мають безпосередній стосунок до суті нашого предмета. У самому справі - при системному управлінні доводиться приймати рішення в умовах, коли наслідки таких рішень заздалегідь достовірно невідомі. При цьому питання: грати чи не грати - не варто! "Грати" треба, треба управляти системою. Ви запитаєте - а як же заборона на експерименти? Відповідь можна дати такий - сама поведінка системи в звичайному її стані може розглядатися як експеримент, з якого при правильній організації збору та обробки інформації про поведінку системи можна очікувати отримання даних для з'ясування особливості системного підходу до вирішення завдань управління.

3.Етапи системного аналізу

3.1 Загальні положення


У більшості випадків практичного застосування системного аналізу для дослідження властивостей і подальшого оптимального управління системою можна виділити наступні основні етапи:  Змістовна постановка задачі

 Побудова моделі досліджуваної системи

 Відшукання рішення задачі за допомогою моделі

 Перевірка рішення за допомогою моделі

 Підстроювання рішення під зовнішні умови

 Здійснення рішення

Зупинимося коротенько на кожному з цих етапів. Будемо виділяти найбільш складні в розумінні етапи і намагатися засвоїти методи їх здійснення на конкретних прикладах.

Але вже зараз зазначимо, що в кожному конкретному випадку етапи системного займають різний "питома вага" в загальному обсязі робіт по тимчасовим, витратним і інтелектуальним показниками. Дуже часто важко провести чіткі межі - вказати, де закінчується даний етап і починається черговий.

3.2 Змістовна постановка задачі


Вже згадувалося, що в постановці задачі системного аналізу обов'язково участь двох сторін: замовника (ОПР) і виконавця даного системного проекту. При цьому участь замовника не обмежується фінансуванням роботи - від нього вимагається (для користі справи) провести аналіз системи, якою він керує, сформульовані цілі та обговорені можливі варіанти дій. Так, - у згаданому раніше прикладі системи управління навчальним процесом однією з причин тихою смерті її була та, що одна з підсистем керівництво Вузом практично не володіла свободою дій по відношенню до підсистеми учнів.

Звичайно ж, на цьому етапі повинні бути встановлені і зафіксовані поняття ефективності діяльності системи. При цьому відповідно до принципів системного підходу необхідно врахувати максимальне число зв'язків як між елементами системи, так і по відношенню до зовнішнього середовища. Ясно, що виконавець-розробник не завжди може, та й не повинен мати професійні знання саме тих процесів, які мають місце в системі або, принаймні, є головними. З іншого боку абсолютно обов'язкова наявність таких знань у замовника - керівника або адміністратора системи. Замовник повинен знати що треба зробити, а виконавець - фахівець в галузі системного аналізу - як це зробити.

Звертаючись до майбутньої вашої професії можна зрозуміти, що вам треба навчитися і того й іншого. Якщо ви опинитеся в ролі адміністратора, то до професійних знань з обліку і аудиту вельми доречно мати знання в галузі системного аналізу - грамотна постановка завдання, з урахуванням технології вирішення на сучасному рівні буде гарантією успіху. Якщо ж ви опинитеся в іншій категорії - розробників, то вам не обійтися без "технологічних" знань в області обліку і аудиту. Робота з системного аналізу в економічних системах навряд чи виявиться ефективною без спеціальних знань в області економіки. Зрозуміло, наш курс торкнеться тільки одну сторону - як використовувати системний підхід в управлінні економікою.

3.3 Побудова моделі досліджуваної системи в загальному випадку


Модель досліджуваної системи в самому лаконічному вигляді можна представити у вигляді залежності

E = f (X, Y) {3 - 1}

де:

E - деякий кількісний показник ефективності системи в плані досягнення мети її існування T, будемо називати його - критерій ефективності.

X - керовані змінні системи - ті, на які ми можемо впливати або керуючі впливи;

Y - некеровані, зовнішні по відношенню до системи впливу; їх іноді називають станами природи.

Зауважимо, перш за все, що можливі ситуації, в яких немає ніякої необхідності враховувати стану природи. Так, наприклад, вирішується стандартна задача розміщення запасів декількох видів продукції і при цьому можемо знайти E цілком однозначно, якщо відомі значення X i і, крім того, деяка інформація про властивості аналізованої системи.

У такому випадку прийнято говорити про прийняття керуючих рішень або про стратегії управління в умовах визначеності.

Якщо ж з впливами навколишнього середовища, з станами природи ми змушені рахуватися, то доводиться управляти системою в умовах невизначеності або, ще гірше - за наявності протидії. Розглянемо першу, на неосвічений погляд - найпростішу, ситуацію.

3.4 Моделювання в умовах визначеності


Класичним прикладом найпростішої задачі системного аналізу в умовах визначеності може служити завдання виробництва і поставок товару. Нехай деяка фірма повинна виробляти і постачати продукцію клієнтам рівномірними партіями в кількості N = 24000 одиниць на рік. Зрив поставок недопустимий, оскільки штраф за це можна вважати нескінченно великим.

Запускати у виробництво припадає одразу всю партію, такі умови технології. Вартість зберігання одиниці продукції C x = 10 копійок на місяць, а вартість запуску однієї партії у виробництво (незалежно від її обсягу) складає C p = 400 гривень.

Таким чином, запускати в рік багато партій явно невигідно, але невигідно і випустити всього 2 партії в рік - занадто великі витрати на зберігання! Де ж "золота середина", скільки партій в рік краще всього випускати?

Будемо будувати модель такої системи. Позначимо через n розмір партії і знайдемо кількість партій за рік - p = N / n 24000 / n.

Виходить, що інтервал часу між партіями становить

t = 12 / p (місяців), а середній запас виробів на складі - n / 2 штук.

Скільки ж нам буде коштувати випуск партії в n штук за один раз?

Порахувати неважко - 0.1  12  n / 2 гривень на складські витрати в рік і 400 p гривень за запуск партій по n штук виробів в кожній.

У загальному вигляді річні витрати складають

E = T n / 2 + N / n {3 - 2}

де T = 12 - повне час спостереження в місяцях.

Перед нами типова варіаційна задача: знайти таке n 0, при якому сума E досягає мінімуму.

Вирішення цього завдання знайти зовсім просто - треба взяти похідну по n та прирівняти цю похідну нулю. Це дає

n 0 = , {3 - 3}

що для нашого прикладу становить 4000 одиниць в одній партії і відповідає інтервалу випуску партій величиною в 2 місяці.

Витрати при цьому мінімальні і визначаються як

E 0 = , {3 - 4}

що для нашого прикладу становить 4800 гривень на рік.

Зіставимо цю суму з витратами при випуску 2000 виробів в партії або випуск партії один раз на місяць (в дусі недобрих традицій соціалістичного планового господарства):

E 1 = 0.1  12  2000/2 + 400  24000/2000 = 6000 гривень в рік.

Коментарі, як кажуть, - зайві!

Звичайно, так просто вирішувати завдання вироблення оптимальних стратегій вдається далеко не завжди, навіть якщо йдеться про детермінованих даних для опису життя системи - її моделі. Існує цілий клас задач системного аналізу і відповідних їм моделей систем, де йдеться про необхідність мінімізувати одну функції багатьох змінних наступного типу:

E = a 1 X 1 + a 2 X 2 + ..... a n X n {3 - 5}

де X i - Шукані змінні, a i - Відповідні їм коефіцієнти або "ваги змінних" і при цьому мають місце обмеження як на змінні, так і на їх ваги.

Завдання такого класу досить добре досліджені в спеціальному розділі прикладної математики - лінійному програмуванні. Ще в докомпьютерную часи були розроблені алгоритми пошуку екстремумів таких функцій E = f (a, X), які так і назвали - цільовими. Ці алгоритми або прийоми використовуються і зараз - служать основою для розробки прикладних комп'ютерних програм системного аналізу.

Системний підхід до вирішення практичних завдань управління економікою, особливо для задач з багатьма десятками сотень або навіть тисячами змінних привів до появи спеціалізованих, типових напрямків як в області теорії аналізу, так і в практиці.

Найбільш "старими" і, отже, найбільш обкатаними є методи вирішення специфічних завдань, які давно вже можна називати класичними.

Фахівцям у галузі ділового адміністрування треба знати ці завдання хоча б на рівні постановки і, головне, в плані моделювання відповідних систем.

Задачі управління запасами

Перші завдання управління запасами були розглянуті ще в 1915 році - задовго не тільки до появи комп'ютерів, але і до вживання терміну "кібернетика". Був обгрунтований метод вирішення найпростішої задачі - мінімізація витрат на замовлення і зберігання запасів при заданому попиті на дану продукцію і фіксованому рівні цін. Рішення - розмір оптимальної партії забезпечувало найменші сумарні витрати за заданий період часу.

Дещо пізніше були побудовані алгоритми рішення задачі управління запасами при більш складних умовах - зміні рівня цін (наявність "знижок за якість" і / або "знижок за кількість"); необхідності обліку лінійних обмежень на складські потужності і т. п.

Задачі розподілу ресурсів

У цих завданнях об'єктом аналізу є системи, в яких доводиться виконувати декілька операцій з продукцією (при наявності декількох способів виконання цих операцій) і, крім того, не вистачає ресурсів або обладнання для виконання всіх цих операцій.

Мета системного аналізу - знайти спосіб найбільш ефективного виконання операцій з урахуванням обмежень на ресурси.

Об'єднує всі такі задачі метод їхнього рішення - метод математичного програмування, зокрема, - лінійного програмування. У самому загальному вигляді задача лінійного програмування формулюється так:

потрібно забезпечити мінімум виразу (цільової функції)

E (X) = C 1 X 1 + C 2 X 2 + ...... + C i X i + ... C n X n {3 - 6} при наступних умовах:

всі X i позитивні і, крім того, на всі X i накладаються m обмежень (M <n)




A 11  X 1 + A 12  X 2 + ...... + A ij  X j + ... A 1n  X n = B 1;

.................................................. ...................................

A i1  X 1 + A i2  X 2 + ...... + A ij  X j + ... A in  X n = B i; {3 - 7}

.................................................. ...................................

A m1  X 1 + A m2  X 2 + ..... + A mj  X j + ... A mn  X n = B m.


Почала теоретичного обгрунтування і розробки практичних методів вирішення завдань лінійного програмування були покладені Д.Данцігом (за іншою версією - Л.В.Канторовичем).

Для більшості конкретних додатків універсальним вважається т. зв. Симплекс-метод пошуку мети, для нього і суміжних методів розроблені спеціальні пакети прикладних програм (ППП) для комп'ютерів.

3.5 Наявність кількох цілей - багатокритеріальність системи


Вельми часто етап змістовної постановки задачі системного аналізу приводить нас до висновку про наявність кількох цілей функціонування системи. У самому справі, якщо деяка економічна система може мати "головну мету" - досягнення максимального прибутку, то майже завжди можна спостерігати ситуацію наявності обмежень або умов. Порушення цих умов або неможливо (тоді не буде самої системи), або свідомо призводить до недопустимих наслідків для зовнішньої Cреди. Коротше кажучи, ситуація, коли мета всього одна і досягти її потрібно будь-якою ціною, практично неймовірна.

Нехай є найпростіша ситуація багатокритеріального - існують тільки дві мети системи T 1 і T 2 і тільки дві можливих стратегії S 1, S 2 .

Нехай ми якось оцінили ефективність E 11 стратегії S 1 по відношенню до T 1 і ефективність ця виявилася рівною 0.4 (по деякій шкалі 0 .. 1). Проробивши таку ж оцінку для всіх стратегій і всіх цілей, ми отримали табличку (матрицю ефективностей):

Таблиця 3.1


E

T 1

T 2

S 1

0.4

0.6

S 2

0.7

0.3
Яку ж із стратегій вважати найкращою? Поки ми не обмовимо значимість кожної з цілей, не вкажемо їх ваги, - сперечатися марно! От якби нам було відомо, що перша мета, до прикладу, в 3 рази важливіше другий, то тоді

можна врахувати їх відносні ваги - скажімо величинами 0.75 для першої та 0.25 для другої. За таких умов сумарні ефективності стратегій (по відношенню до всіх цілям) складуть:

для першої E 1 = 0.4  0.70 + 0.6  0.30 = 0.28 + 0.18 = 0.46;

для другої E 2 = 0.8  0.70 + 0.2  0.25 = 0.56 + 0.05 = 0.61;

так що відповідь на питання про вибір стратегії далеко не очевидний.

Отже, критерій ефективності системи за наявності кількох цілей доводиться виражати через ефективності окремих стратегій вигляді: E s =  S t U t {3 - 8}

тобто враховувати ваги окремих цілей U t.

Якщо ви уважно стежили за міркуваннями при розгляді прикладу {3-2}, то зараз можете збагнути, що по суті справи там мова йшла про двох цілях. З одного боку, ми хотіли б мати якомога менші партії - їх дешевше зберігати (малий термін зберігання). з іншого боку, нам були бажані великі партії, оскільки при цьому менше витрати на запуск партій у виробництво. Якби ми перебирали всі 365 можливих стратегій (від зміни партії кожен день до однієї на рік), то, звичайно ж, знайшли б оптимальну стратегію зі зміною партій кожні два місяці. Інша справа, що в нашому розпорядженні була аналітична модель системи (формула сумарних витрат).

Так от - вагові коефіцієнти цілей в тій моделі були рівними і ми їх могли не помічати при пошуку мінімуму витрат. Ну, а що робити, якщо "важливість" цілей доводиться вимірювати не за шкалою Int або Rel, т. е. в числовому вигляді, а за шкалою Ord? Іншими словами - звідки беруться вагові коефіцієнти цілей?

Дуже рідко вагові коефіцієнти визначаються однозначно по "фізичним змістом" задачі системного аналізу. Частіше ж усього їх відшукання можна називати "призначенням", "придумуванням", "пророкуванням" - тобто ніяк не "науковими" діями.

Іноді, як не дивно це звучить, вагові коефіцієнти призначаються шляхом голосування - явного чи таємного. Справа в тому, що в ситуаціях, коли немає числового методу оцінки ваги мети, реальним виходом з положення є використання накопиченого досвіду.

Нерідко задає вагові коефіцієнти безпосередньо ОПР, але частіше його досвід управління підказує: одна голова - добре, а багато розумних голів - куди краще. Приймається особливе рішення - використовувати метод експертних оцінок ..

Суть цього методу досить проста. Потрібно чітко обумовити всі цілі функціонування системи і запропонувати групі осіб, високо компетентних в даній галузі (експертів) хоча б розташувати всі цілі за значимістю, за "призовим місцям" або, на мові ТССА, по рангах.

Вищий ранг (зазвичай 1) означає найбільшу важливість (вага) цілі, наступний за ним - кілька меншу вагу і т. д. Спеціальний розділ непараметричної статистики - теорія рангової кореляції, дозволяє перевірити гіпотези про значущість отриманої від експертів інформації. Розвиток рангової кореляції, її інший розділ, дозволяє встановлювати згоду, узгодженість думок експертів або рангову конкордації.

Це особливо важливо у випадках, коли не тільки виникла потреба використати думки експертів, але й існує сумнів в їх компетентності.

3.6 Експертні оцінки, рангова кореляція і конкордації


Нехай в процесі системного аналізу нам довелося враховувати деяку величину U, вимір якої можливо лише за порядковою шкалою (Ord). Наприклад, нам доводиться враховувати 10 цілей функціонування системи і потрібно з'ясувати їх відносну значимість, питомі ваги.

Якщо є група осіб, компетентність яких в даній області не викликає сумнівів, то можна опитати кожного з експертів, запропонувавши їм розташувати цілі по важливості або "проранжувати" їх. У найпростішому випадку можна не дозволяти повторювати ранги, хоча це не обов'язково - повторення рангів завжди можна врахувати.

Результати експертної оцінки в нашому прикладі уявимо таблицею рангів цілей:

Таблиця 3.2

Експерти

1

2

3

4

5

6

7

8

9

10

Сума

A

3

5

1

8

7

10

9

2

4

6

55

B

5

1

2

6

8

9

10

3

4

7

55

Сума рангів

8

6

3

14

15

19

19

5

8

13



Сумарний ранг

4.5

3

1

7

8

9.5

9.5

2

4.5

6

55
Навчальний матеріал
© uadoc.zavantag.com
При копіюванні вкажіть посилання.
звернутися до адміністрації