Читайте также:
|
|
Ортақ жадылы параллель компьютерлерді пайдаланушылардың оларға деген қатынасы әрқашанда бірмәнді болмады. Бір жағынан, компьютерлердің бұл класын бағдарламалау таратылған жадылы есептеу кластерін бағдарламалауға қарағанда едәуір қарапайым болып табылады. Бұл жағдайда, массивтердің таратылуын ойлап қажеті жоқ, бағдарламалардың ішкі параллельділігі жеңіл сипатталады, жөндеу процесі тезірек жүреді. Екінші жағынан, бұл компьютерлер класының классикалық түрлерінің екі кемшілігі бар: процессорлар саны аз және олардың бағасы өте жоғары. Бірыңғай адрестік кеңістікте жұмыс істеуін сақтай отырып, процессорлар санын көбейту үшін әртүрлі шешімдер ұсынылды. Соның бірі соңғы жылдары кең тараған нұсқа ссNUMA (cache coherent Non Uniform Memory Access) архитектурасы негізіндегі шешім. Мұндай архитектурада компьютердің жадысы физикалық тұрғыдан таратылған (бөлінген), ол оның масштабталу потенциалын едәуір арттырады. Сонымен қатар мұнда жады логикалық тұрғыдын ортақ болып қалады. Бұл SMP компьютерлері үшін жасалған программалау әдістері мен барлық технологияларды пайдалануға мүмкіндік береді. Мұндай архитектурада жекелеген процессорлардың кэш-жадысының мазмұны аппаратура деңгейінде жедел жады мазмұнымен үйлеседі (кэштің когеренттілік мәселесі шешіледі, cache coherence problem). SMP компьютерлерімен салыстырғанда процессорлар санын едәуір арттыра отырып, ссNUMA архитектурасы ортақ жадылы компьютерлерге тән емес қосымша ерекшеліктерді ұсынды. Жадыға қатынау уақыты бұл қатынастың түріне, яғни жергілікті немесе қашықтағы жадыға екеніне байланысты. Бағдарламаны жазу процесі өзгермей қалады, және жадының физикалық таратылуы бағдарламашыға көрінбейді. Бірақ-та, бағдарламаның тиімділігі жадыға қатынаудың «біртекті еместік» дәрежесіне тікелей байланысты екендігі түсінікті болуы анық.
Осы класқа жататын компьютерлер архитектурасын зерттеуді Hewlett Packard Superdome есептеу жүйесін мысалға ала отырып жүргізіп көрейік. Компьютер 2000 жылы пайда болды, ал 2001 жылы қараша айында өткен Тор 500 тізімінде олар 147 позицияны иеленіп үлгерді. Стандартты комплектіде, Hewlett Packard Superdome компьютері жүйені одан ары кеңейтуге мүмкіндік бере отырып, 2-ден 64 процессорларға дейін біріктіре алады. Барлық процессорлар ссNUMA архитектурасына сәйкес ұйымдастырылған ортақ жадыға қатынай алады. Бұл біріншіден, барлық процестер дәстүрлі оқу/жазу операциялары арқылы кезкелген жады байтын адрестей отырып, бірыңғай адрестік кеңістікте жұмыс істей алады дегенді білдіреді. Екіншіден, жойылған жадыға қатынауға қарағанда, жүйедегі жергілікті (локальді) жадыға қатынау біршама тезірек жүреді. Үшіншіден, процессорлардың кэш-жадысында туындайтын деректердің мүмкін сәйкессіздіктері мәселелері аппаратура деңгейінде шешілген. Максималды конфигурацияда Superdome компьютерінде жедел жады 256 Гбайт-қа дейін болуы мүмкін. Компанияның жақын келешектегі жоспарының бірі - компьютер жадысын 1 Тбайтқа дейін жеткізу.
Hewlett Packard Superdome компьютерінің архитектурасы, онда микропроцессорлардың бірнеше түрін (типін) пайдалана алатындай етіп жобаланған. Бұл әрине, HP Superdome есептеу жүйесі үшін дәстүрлі РА ұрпағындағы процессорлар: РА-8600 және РА-8700. Сонымен қатар, есептеу жүйесі НР және Intel компаниялары бірігіп құрастырған процессорлардың IA-64 архитектуралы келесі ұрпағын да пайдалануға толық дайындалған.
HP Superdome компьютері архитектурасының негізін айырып/қосқыштардың иерархиялық жүйесімен байланысқан есептеу ұяшықтары (cells) құрайды. Әрбір ұяшық, барлық қажетті компоненттері бар бір тақшада жүзеге асырылатын симметриялық мультипроцессор болып табылады (28 - сурет):
•процессорлар (4-ке дейін);
•оперативті жады (16 Гбайтқа дейін);
•ұяшық бақылаушысы;
•қорек көзін түрлендірушілер;
• енгізу/шығару жүйесімен байланыс.
Hewlett Packard Superdome ұяшықтары жаңа заманғы ссNUMA компьютерлерінің архитектуралық элементтерімен көп ұқсас болып келеді. Hewlett Packard Superdome компьютерінде мұндай элемент болып ұяшық, SGI Origin 3x00 типті машиналарында торап (node), ал Compad Alphaserver GS320 сериялы компьютерлерде - QBB (Quad Building Block) болады. Барлық жүйелерде әрбір элемент 4 процессордан тұрады.
28 сурет. Hewlett Packard Superdome компьютері
ұяшықтарының құрылымы.
Superdom компьютерінің ұяшық архитектурасында басты орынды ұяшық бақылаушысы (контроллер) алады. Бақылаушы - құрамында 24 миллион транзисторы бар күрделі құрылғы. Ұяшықтың әрбір процессоры үшін бақылаушыда өзінің арнайы порттары бар. Әрбір процессор мен контроллер арасындағы деректермен алмасу жылдамдығы 2 Гбай/с. Ұяшықтың жадысы 2 - 16 Гбайт құрайды. Ол әрқайсысының ұяшық бақылаушысында өз порты бар 2 банкаға бөлінген. Контроллер мен әрбір банк арасындағы ақпаратты (деректерді) алмасу жылдамдығы 2 Гбайт/с.
Ұяшық бақылаушысының бір порты әрқашан сыртқы коммутатормен байланысқан. Ол ұяшық процессорларын жүйедегі басқа процессорлармен алмастыру үшін қажет. Бұл порттың жұмысының жылдамдығы 8 Гбайт/с.
Процессор, жады басқа ұяшықтар және сыртқы орта арасындағы интерфейстік функцияларын (қызметтерін) орындай отырып, ұяшық контроллері процессорлардың кэш жадысының когеренттігіне де жауап береді.
Ұяшық – бұл компьютердің төрт процессорлық базалық блогы. Superdome компьютерінің 64 процессорлы конфигурациясы әрбірінде 32 процессоры бар 2 бағаннан тұрады (29 сурет).
|
29 сурет. Hewlett Packard Superdome компьютерінің
жалпы құрылымы.
Әрбір бағанның құрамында 2-ден сегізпортты бұғаттамайтын коммутаторлар бар. Коммутаторлардың барлық порттары 8 Гбайт/с жылдамдықпен жұмыс істейді. Әрбір коммутаторға төрт ұяшықтан қосылады (жалғанады). Коммутатордың 3 порты жүйедегі басқа коммутаторлармен байланысын іске асырады (біреуі осы бағанда, екі коммутатор келесіде). Қалған порты Hewlett Packard Superdome компьютерінің басқа жүйелерімен байланыс жасау үшін сақталып қойылған, яғни бұл компьютердің процессорларының жалпы саны 64-тен көп болатын көпторапты конфигурациясын құрастыру мүмкіндігін береді деген сөз.
ссNUMA архитектуралы кезкелген есептеу жүйесінің басты сұрақтарының бірі, процессордың жергілікті және қашықтағы жадыға қатынасы кезіндегі уақыт айырмашылығы болып табылады. Әрине, SMP – компьютеріндегі сияқты бұл айырмашылықтың мүлде болмағаны дұрыс болар еді. Бірақ бұл жағдайда жүйе нашар масштабталатын болады. HP Superdome компьютерінде процессордың жадыға қатынасы кезінде үш түрлі бөгелістер болуы мүмкін:
· процессор және жады бір ұяшықта орналасады; бұл жағдайда бөгеліс минималды;
· процессор және жады әртүрлі ұяшықтарда орналасады, бірақ бұл екі ұяшық та бір коммутаторға жалғастырылған;
· процессор және жады әртүрлі ұяшықтарда орналасады, және бұл екі ұяшық әртүрлі коммутаторларға жалғастырылған; бұл жағдайда сұраныс екі коммутатор арқылы өтуі тиіс және бөгелістер максималды болады.
Әрине, бұл жерде, бөгеліс шамасы тек қана процессор мен жадының өзара орналасуына ғана емес, сонымен қатар процессорлар санына да байланысты екені түсінікті. Есептеу жүктемесінің сипаты да маңызды параметрлерге жатады. Мысалы, бірмезгілде жұмыс істеп тұрған қолданбалар санына байланысты бөгеліс өзгеруі мүмкін. Бөгелістің процессорлар санына байланысы екі ситуация үшін 1-ші кестеде көрсетілген [9, 13]. Бірінші жағдайда біртарамды қолданбалар, ал екіншісінде көптарамды бағдарламалар жұмыс істейді. Бірінші жағдайдан айырмашылығы, екінші жағдайда процессорлар кэш-жадысы когеренттігіне қолдау көрсету үшін қосымша шығындар пайда болады. Екі жағдайда да кестеде бөгелістің орта көрсеткіштері келтірілген және сұраныстардың жадыға таратылуы бірқалыпты деп есептеледі.
1 кесте. Процессорлар және жүктеулер санына байланысты бөгеліс
Процессорлар саны | Біртарамды бағдарламалар нс | Көптарамды бағдарламалар нс |
Көріп отырғанымыздай, 4 процессорлы конфигурациядан 64-процессорлыққа көшкендегі бөгелістің арту коэффициенті бар болғаны 1,6 есе. Яғни, пайдаланушы көп жағдайларда дәстүрлі SMP-компьютерлері үшін құрылған өз бағдарламаларының тиімді іске асырылатынынан үміттенуге болады деп айта аламыз.
HP Superdome компьютері көптеген қызықты ерекшеліктерге ие. Мысалы, компьютердің бағдарламалық-аппараттық ортасы оны әртүрлі баптауға мүмкіндік береді. Hewlett Packard Superdome компьютерін әртүрлі бірнеше операциялық жүйелермен жұмыс істейтін (HP UX, Linux, Windows 2000) бір-біріне тәуелсіз бөлімдердің жиыны ретінде де құрастыруға болады. HP Superdome компьютері архитектурасының ерекшеліктерімен таныса отырып, ондағы пайдаланылатын РА-8700 процессорының құрылымын қысқаша қарастырып өтейік. Егер біз тұтас жүйені тиімді пайдаланғымыз келсе, онда оның базалық компоненттерінің ерекшеліктері туралы жалпылама түрде болса да түсінігіміз болуы қажет.
Процессордың тактілік жиілігі 750 МГц. Максималды жүктелу кезінде ол бір тактіде төрт арифметикалық амал орындай алады. Бұл екі параметр оның шектік өнімділігінің мәнін анықтайды – 3 Гфлопс. Бұдан базалық 64-процессорлы HP Superdome компьютерінің шектік өнімділігі алынады – 192 Гфлопс.
РА-8700 процессорының архитектурасы суперскалярлық. Ол әрбір тактіде кодтың ақпараттық құрылымы қанша операция орындауға мүмкіндік бере алса сонша орындайды және де осы мезетте қанша функционалдық құрылғы қолжетімді болса соншама орындайды. РА-8700 процессоры барлығы 10 функционалдық құрылғыдан тұрады: төрт құрылғы бүтін санды арифметика және логика үшін, төртеуі нақты арифметикамен жұмыс істеуі үшін, екі құрылғы оқу/жазу операциясы үшін. Әрбір тактіде командаларды таңдау құрылғысы кэш-жадыдан 4 команданы оқи (считывает) алады. Процессордың кэш-жадысының көлемі 2,25 Мбайт, оның 1,5 Мбайты кэш деректерге бөлінсе, қалған 0,75 Мбайт – ол командалар кэші.
Жалпы HP Superdome компьютерлерінің пайдаланылу облысы өте кең. Россияны алатын болсақ, ғылыми-техникалық есептерді шешуге арналған 64-процессорлы бір HP Superdome компьютері Межведомствалық суперкомпьютерлік орталықта орналасқан, ал 72-процессорлы екінші компьютер Россияның Сбербанкінде жұмыс істеуде.
Енді ортақ жадылы есептеу жүйелерінің нақты бағдарламалар өнімділігін төмендетуге алып келетін кейбір ерекшеліктерін атап өтейік.
Амдал заңы әмбебап сипатқа ие болғандықтан, ол барлық параллель есептеу жүйелерімен бірге еске алынады. Егер бағдарламада барлық операциялардың 20 % қатаң тізбекті түрде орындалатын болса, онда пайдаланылған процессорлар санына байланыссыз 5-тен көп үдеу алу мүмкін емес (мұнда кэш-жадының әсері қарастырылмайды). Бұны жаңа параллель кодты жобалауда да, ескі тізбекті бағдарламаны осы архитектураға лайықтап келтіру алдында да ескеру керек.
Осы класты жүйелерде жадымен жұмыс істеу өте «ерекше» болып есептеледі. Өнімділікті төмендететін себептердің бірі – жадыға біртекті емес қатынастың болуын біз жоғарыда талдаған болатынбыз. 5-10 % деңгейіндегі біртекті еместік дәрежесі аса қиын мәселелерді тудыра қоймайды. Бірақ, жергілікті және қашықтағы жадыға бірнеше рет қатынаудағы уақыт айырмашылығы, пайдаланушыдан бағдарламалауды өте мұқият жүргізуді талап етеді. Бұл жағдайда оған, таратылған жадылы жүйелер үшін деректерді тарату сияқты сұрақтарды шешуге тура келеді. Басқа себеп – жадыға қатынаудағы қақтығыстар, көптеген SMP-жүйелері үшін де тиесілі.
Әрбір процессордың өз кэш-жадысы болуы да қосымша ерекшеліктерге әкеледі. Оларың ішіндегі аса маңыздысы кэш-жады мазмұнының үйлесімділігін қамтамасыз ету қажеттілігінен тұрады. Осыдан келіп ссNUMA аббревиатурасындағы алғашқы екі әріптің пайда болуы шығады. Бұл мәселені шешуге аппаратура неғұрлым сирек тартылған сайын, бағдарламаның орындалуында соғұрлым шығындар аз болады. Осы себепке байланысты ортақ жадылы көптеген есептеу жүйелерінде процесстерді процессорларға таңатын параллель бағдарламаны орындау режимі бар.
Кезкелген соңғы жылдары шыққан процессордың архитектурасы күрделі болып келеді. Олар жадының бірнеше деңгейін және көптеген функционалдық құрылғыларды біріктіреді. Жеке процессордың нақты өнімділігінің оның шектік өнімділігінен айырмашылығы ондаған есені құрауы мүмкін. Әрбір процессордың мүмкіндігін пайдалану дәрежесі неғұрлым жоғары болған сайын, есептеу жүйесінің жалпы өнімділігі де соғұрлым жоғары болары анық.
Тағы да алдыңғы параграфтағыдай оның өнімділігіне әсер ететін компьютер ерекшеліктерін одан ары жалғастыра беруге болады. Оның бәрі әрбір бағдарламада қандай да бір дәрежеде пайда болады. Осыдан келіп төмен өнімділік мәселелері, пайдаланушылар мәселелері келіп шығады. Әрине, бұл шешілетін мәселелер, бірақ шешудің дұрыс тәсілін таңдау үшін оларды анық түсіну және көрсете алу керек.
Дата добавления: 2015-10-29; просмотров: 699 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Функционалдық құрылғылар | | | Таратылған жадылы есептеу жүйелері |