Relāciju datu modeļa struktūra. Relāciju datu modelis

Attiecības (tabulas) atbilst noteiktiem integritātes nosacījumiem. RMD atbalsta deklaratīvās integritātes ierobežojumus domēna (datu tipa) līmenī, relāciju līmenī un datu bāzes līmenī.

  • Apstrādes (manipulācijas) aspekts (komponents) - RMD atbalsta relāciju manipulācijas operatorus (relāciju algebra, relāciju aprēķins).
  • Turklāt relāciju datu modelis ietver normalizācijas teoriju.

    Termins "relāciju" nozīmē, ka teorija balstās uz matemātisko attiecību jēdzienu ( attiecības). Vārdu tabula bieži lieto kā neformālu sinonīmu terminam “attiecības”. Jāatceras, ka “galds” ir brīvs un neformāls jēdziens un bieži vien nenozīmē “attiecības” kā abstraktu jēdzienu, bet gan vizuālu attiecību attēlojumu uz papīra vai ekrāna. Nekorekta un vaļīga termina “tabula” lietošana vārda “attiecības” vietā bieži vien rada pārpratumus. Visizplatītākā kļūda ir domāt, ka RMD nodarbojas ar “plakanām” vai “divdimensiju” tabulām, ja tādas var būt tikai tabulu vizuāls attēlojums. Attiecības ir abstrakcijas, un tās nevar būt ne “plakanas”, ne “neplakanas”.

    Lai labāk izprastu RMD, jāņem vērā trīs svarīgi apstākļi:

    • modelis ir loģisks, tas ir, attiecības ir loģiskas (abstraktas), nevis fiziskas (glabātas) struktūras;
    • Relāciju datu bāzēm informācijas princips ir patiess: viss datu bāzes informācijas saturs tiek attēlots vienā un tikai vienā veidā, proti, skaidri norādot atribūtu vērtības relāciju kortos; jo īpaši nav norādes (adreses), kas saistītu vienu vērtību ar citu;
    • Relāciju algebras klātbūtne ļauj veikt deklaratīvu programmēšanu un deklaratīvu integritātes ierobežojumu aprakstu, papildus navigācijas (procedūras) programmēšanai un procesuālo nosacījumu pārbaudei.

    Relāciju modeļa principus 1970. gados formulēja E. F. Kods. Koda idejas pirmo reizi publiski tika prezentētas rakstā "A Relational Model of Data for Large Shared Data Banks", kas kļuvis par klasiku.

    Stingrs izklāsts par relāciju datu bāzu teoriju (relāciju datu modeli) mūsdienu izpratnē ir atrodams K. J. Data grāmatā. "C. J.Datums. An Introduction to Database Systems" ("Date, K. J. Introduction to Database Systems").

    Vispazīstamākās relāciju modeļa alternatīvas ir hierarhiskais modelis un tīkla modelis. Dažas sistēmas, kas izmanto šīs vecās arhitektūras, joprojām tiek izmantotas šodien. Papildus var minēt objektorientēto modeli, uz kura tiek veidotas tā sauktās objektorientētās DBVS, lai gan skaidras un vispārpieņemtas šāda modeļa definīcijas nav.

    Piezīmes

    Literatūra

    • Datums K.J. Ievads datu bāzu sistēmās. - 8. izd. - M.: “Viljamss”, 2006. - 1328 lpp. - ISBN 0-321-19784-4
    • Tomass Konolijs, Karolīna Bega Datu bāzes. Projektēšana, ieviešana un atbalsts. Teorija un prakse = Database Systems: A Practical Approach to Design, Implementation and Management Trešais izdevums. - 3. izdevums. - M.: “Williams”, 2003. - P. 1436. - ISBN 0-201-70857-4
    • Kuzņecovs S.D. Datu bāzes pamati. - 2. izd. - M.: Interneta Informācijas tehnoloģiju universitāte; BINOMĀLS. Zināšanu laboratorija, 2007. - 484 lpp. - ISBN 978-5-94774-736-2
    • Kogalovskis M.R. Datu bāzu tehnoloģiju enciklopēdija. - M.: Finanses un statistika, 2002. - P. 800. - ISBN 5-279-02276-4

    Wikimedia fonds.

    2010. gads.

      Skatiet, kas ir “relāciju datu modelis” citās vārdnīcās: Izstrādāja E. Codd 1970. gadā. loģisks datu modelis, kas apraksta: datu struktūras kā (laikā mainīgas) attiecību kopas; kopu teorētiskās darbības ar datiem: savienojums, krustojums, atšķirība un Dekarta reizinājums; ...

      Finanšu vārdnīca relāciju datu modelis

      - Datu modelis, kura pamatā ir datu attēlošana kā relāciju kopa, no kurām katra ir noteiktu kopu Dekarta reizinājuma apakškopa, un manipulēšana ar tām, izmantojot dažādas relāciju algebras darbības vai... ... Relāciju datu modelis - 61. Relāciju datu modelis Datu modelis, kura pamatā ir datu attēlošana kā relāciju kopa, no kurām katra ir noteiktu kopu Dekarta reizinājuma apakškopa, un manipulēšana ar tām, izmantojot kopu... ...

      Relāciju datubāze Datubāze, kuras pamatā ir relāciju datu modelis. Vārds "relācijas" nāk no angļu valodas. attiecības. Lai strādātu ar relāciju datu bāzēm, tiek izmantotas relāciju DBVS. Izmantojot relāciju datu bāzes... ...Wikipedia

      relāciju datu bāze- Datu bāze ieviesta saskaņā ar relāciju datu modeli. [GOST 20886 85] relāciju datu bāze Datubāze, kas loģiski organizēta kā tās komponentu attiecību kopa. Relāciju datu bāzes raksturīga iezīme ir... ... Tehniskā tulkotāja rokasgrāmata

      Datu loģiskais datu modelis, stingra matemātiska teorija, kas apraksta relāciju datu bāzu strukturālo aspektu, integritātes aspektu un datu apstrādes aspektu. Datu strukturālais aspekts (komponents) datubāzē ir... ... Wikipedia

      Klasiskajā datu bāzes teorijā datu modelis ir formāla teorija datu attēlošanai un apstrādei datu bāzes pārvaldības sistēmā (DBVS), kas ietver vismaz trīs aspektus: 1) struktūras aspektu: veidu aprakstīšanas metodes un ... ... Wikipedia

      Hierarhiskais datu modelis ir datu bāzes attēlojums koka (hierarhiskas) struktūras veidā, kas sastāv no dažāda līmeņa objektiem (datiem). Starp objektiem ir savienojumi, katrs objekts var ietvert vairākus objektus... ... Wikipedia

      Tīkla DBVS raksta saturs ir jāpārnes uz šo rakstu un jāiestata novirzīšana no turienes. Jūs varat palīdzēt projektam, apvienojot rakstus (skatiet sapludināšanas norādījumus). Ja nepieciešams apspriest apvienošanās iespējamību, ... ... Wikipedia

      - (angļu valodā Associative model of data) ir datu attēlojuma modelis, ko ierosinājis Saimons Viljamss:2, kurā datu bāze sastāv no divu veidu elementu un saišu datu struktūrām, kas glabājas vienā viendabīgā kopīgā ... ... Wikipedia

    Grāmatas

    • Datu bāzes: Mācību grāmata. Kuzņecovs S.D. , Kuzņecovs S.D. , Mācību grāmata izveidota saskaņā ar federālo štata izglītības standartu studiju jomā “Lietišķā matemātika un datorzinātnes” (kvalifikācija “Bakalaurs”). Mācību grāmatā... Kategorija: Mācību grāmatas augstskolām Sērija: Universitātes mācību grāmata Izdevējs: Academy, Ražotājs:

    Ievads…………………………………………………………2

    Relāciju datu modelis…………………………………………………………4

    Projektēšanas mērķi un uzdevumi…………………………….8

    Projektēšanas procesa struktūra………………………….9

    Informācijas sistēmas uzturēšanas tehnoloģija………………..11

    Secinājums………………………………………………………13

    Atsauces…………………………………………………………14

    IEVADS

    Cilvēce strauji ieiet principiāli jaunā informācijas laikmetā. Ievērojami mainās visas cilvēku dzīvesveida sastāvdaļas. Mūsdienu sabiedrībā informatizācijas līmenis raksturo valsts attīstības līmeni. 21. gadsimta sākumu eksperti dēvē par datortehnoloģiju gadsimtu. To revolucionārā ietekme skar valdības struktūras un pilsoniskās sabiedrības institūcijas, ekonomikas un sociālo jomu, zinātni un izglītību, kultūru un cilvēku dzīvesveidu. Daudzas attīstītās un jaunattīstības valstis ir pilnībā apzinājušās milzīgos ieguvumus, ko sniedz informācijas un komunikācijas tehnoloģiju attīstība un izplatība. Neviens neapšauba faktu, ka virzība uz informācijas sabiedrību ir ceļš uz cilvēces civilizācijas nākotni.

    Informatizācija savā dziļākajā būtībā ir process, kurā cilvēks pārveido savas eksistences vidi, biosfēru, par noosfēru, kura rezultāts būs augsti attīstītas informācijas vides izveide. Šis process ietekmē gan vidi, gan pašu sabiedrību, pašu cilvēku.

    Veicamo transformāciju dziļums rada problēmas, kuru savlaicīga un efektīva risināšana ir atkarīga ne tikai no informatizācijas gaitas, bet, ja iznākums ir nelabvēlīgs, no visas sabiedrības un cilvēka kā bioloģiskās pastāvēšanas. sugas.

    Ražošanas un informācijas apstrādes informatizācijas problēmas, tas ir, mūsdienu mašīnu ražošanas izveides un attīstības problēmas informācijas sfērā, rada pretruna starp nepieciešamību visās cilvēka darbības jomās savlaicīgi izmantot liela apjoma liela apjoma kvalitatīva informācija un nespēja ātri ģenerēt šādus apjomus, izmantojot tradicionālos informācijas līdzekļus, tehnoloģijas un līniju sakarus. Šī jautājumu grupa galvenokārt ietver loģistikas, tehnoloģiskās un komunikācijas problēmas. Krievija joprojām ir lielvalsts - gan gigantiska teritorija, gan spēcīga industriālā bāze, un tajā pašā laikā turpina piedzīvot dziļu politisko un sociālekonomisko krīzi, kas var pārvērsties vai nu ilgtermiņa sabrukumā, kura pamatā ir grūti sasniedzama Atgriezenisks reģionālās suverenizācijas process vai īslaicīga stabilizācija par, kaut arī lēnu, diezgan ilgtspējīga ekonomiskā un sociālā progresa procesu, kas spēj nodrošināt tai svarīgu lomu kā pasaules lielvarai un pienācīgu dzīves līmeni tās iedzīvotājiem.

    Informācijas un komunikācijas tehnoloģiju (turpmāk – IKT) attīstība un plaša izmantošana ir pēdējo desmitgažu globāla tendence pasaules attīstībā. Moderno tehnoloģiju izmantošana informācijas apstrādē un pārraidē ir izšķiroša gan ekonomikas konkurētspējas paaugstināšanai un iespēju paplašināšanai tās integrācijai globālajā ekonomiskajā sistēmā, gan valsts pārvaldes procesu efektivitātes paaugstināšanai visos pārvaldes līmeņos, līmenī. pašvaldību, valsts un nevalstiskajās tautsaimniecības nozarēs ,.

    Tikpat nozīmīgs rezultāts IKT izplatībai un izplatībai visās sabiedriskās dzīves jomās ir tehnoloģisko priekšnoteikumu radīšana pilsoniskās sabiedrības attīstībai, patiesi nodrošinot iedzīvotāju tiesības uz brīvu un ātru piekļuvi informācijai globālajā internetā.

    Krievija, neraugoties uz augstiem informācijas tehnoloģiju attīstības tempiem pēdējā desmitgadē, nav spējusi samazināt atšķirību no industriāli attīstītajām valstīm ekonomikas un sabiedrības informatizācijas līmenī. Šo situāciju daļēji izraisa vispārēji ekonomiski iemesli (ieilgusi krīze ekonomikā, zems lielākās daļas iedzīvotāju materiālās labklājības līmenis u.c.). Tajā pašā laikā IKT nepietiekamo attīstību Krievijā nosaka vairāki faktori, kas rada mākslīgus šķēršļus informatizācijas paātrināšanai, IKT plašai ieviešanai un efektīvai izmantošanai valsts un nevalstiskajās tautsaimniecības nozarēs, vietējā IKT ražošanas sektora attīstība. Šādi negatīvi faktori ietver:

    Nepilnīgs, nepilnīgs un novecojis normatīvais regulējums, kas izstrādāts, neņemot vērā mūsdienu informācijas tehnoloģiju sniegtās iespējas, sākotnēji orientēts uz ierobežojošu pieeju attiecībā uz iedzīvotāju un uzņēmēju piekļuvi informācijai;

    Nepietiekama moderno informācijas tehnoloģiju attīstība valsts pārvaldes jomā, radot šķēršļus IKT paātrinātai izplatībai pārējā ekonomikā un sabiedrībā; visu līmeņu valdības struktūru negatavība izmantot efektīvas tehnoloģijas, lai pārvaldītu un organizētu mijiedarbību ar iedzīvotājiem un uzņēmējdarbības vienībām;

    Līdzšinējās informatizācijas programmu īstenošanai piešķirto budžeta līdzekļu izlietošanas prakses dārgums nestimulē efektīvu ieguldījumu atdevi;

    Nepietiekama uzmanība personāla sagatavotības līmenim gan radīšanas jomā, gan informācijas tehnoloģiju izmantošanas jomā;

    Šķēršļi Krievijas IKT nozares uzņēmumu ienākšanai iekšzemes Krievijas un pasaules tirgos sakarā ar pārmērīgu saimnieciskās darbības regulējumu, prasībām par obligātu, bieži vien pārmērīgu darbību sertifikāciju un licencēšanu;

    Augsts monopolizācijas līmenis telekomunikāciju infrastruktūras jomā, kas ir augsto ienākšanas šķēršļu sekas un, ja nav pienācīga regulējuma, rada tarifu politikas traucējumus, kas nav saistīti ar tirgu;

    Šaura tehniskā izpratne par IKT lomu un iespējām, zema kultūra darbam ar IKT.

    Šīs federālās mērķprogrammas ietvaros risinātās problēmas ir balstītas uz Krievijas sociāli ekonomiskās attīstības stratēģijas prioritātēm un mērķiem laika posmam līdz 2010. gadam un atbilst federālo mērķprogrammu saraksta veidošanas kritērijiem, sākot ar 2002.gadā, apstiprināts Krievijas Federācijas valdības sēdē 2000.gada 21.septembra sēdē, protokols Nr.31.

    Jau šobrīd visos līmeņos aktīvi norisinās informatizācijas procesi. Daudzas aktivitātes, kuru mērķis ir informācijas tehnoloģiju attīstība, tiek īstenotas vai plānotas īstenot citu federālo, reģionālo un departamentu programmu ietvaros (piemēram, federālā mērķprogramma "Elektroniskās tirdzniecības attīstība Krievijā 2002.-2006. gadam", federālā mērķprogramma). Mērķprogramma "Krievijas Federācijas vienotas informācijas un izglītības vides attīstība 2002.-2006. gadā", Federālā mērķprogramma "Informācijas un telekomunikāciju sistēmas izveide un attīstība speciālām vajadzībām".

    iecelšana amatā valsts iestāžu interesēs 2001.-2007. gadam" utt.). Šajā aspektā Federālā mērķprogramma "Elektroniskā Krievija 2002.-2010. gadam" (turpmāk tekstā Programma) ir paredzēta ne tikai kā papildinājums citām programmām IKT nozarei atbilstošas ​​institucionālās un tiesiskās vides veidošanas termiņos, attīstot publisko piekļuves tīklu infrastruktūru un nodrošinot efektīvu valsts un sabiedrības mijiedarbību, kas balstīta uz plašu IKT ieviešanu, bet veiks arī virkni vispārīgāku, koordinējošās funkcijas attiecībā uz citām programmām Programmā kā viens no galvenajiem valsts virzieniem tiks noteikti vispārīgi konceptuālie virzieni (pamatprincipi, vispārīgi standarti un standarta risinājumi dažādu projektu īstenošanai). sociāli ekonomiskā attīstība IKT attīstības vispārīgo konceptuālo virzienu īstenošana tiks veikta galvenokārt dažādās federālajās, departamentu un reģionālajās programmās.

    Federālā mērķprogramma ne tikai piedāvā risinājumus acīmredzamām problēmām, bet arī rada vairākas jaunas problēmas. Dažas no šīm problēmām nevar atrisināt Elektroniskās Krievijas 2002-2010 ietvaros. Lai, piemēram, ar informācijas tehnoloģiju palīdzību tuvinātu Krievijas izglītības sistēmu attīstīto Rietumu valstu standartiem, tiek izstrādāta programma “Vienotas izglītības informācijas vides izveide 2002.-2006.gadam”. Un ir nepieciešama šo problēmu detalizēta diskusija. Izsakām cerību, ka projekts “Elektroniskā Krievija” kļūs par ērtu platformu šādas diskusijas uzsākšanai, kurā piedalīsies ne tikai valdības aparātu un Krievijas IT tirgu pārstāvošie speciālisti, bet arī visi, kas saprot izvirzīto jautājumu svarīguma pakāpi. programmā var piedalīties.

    RELĀCIJU DATU MODELIS

    Saskaņā ar relāciju modeli datu bāze tiek attēlota kā tabulu kopums, kurā var veikt darbības, kas formulētas relāciju algebras un relāciju aprēķinu izteiksmē. Relāciju modelī operācijām ar datu bāzes objektiem ir kopu teorētisks raksturs.

    Relāciju datu modeļa jēdzieni ir saistīti ar slavenā datu bāzes sistēmu speciālista E. Koda vārdu. Tāpēc relāciju datu modeli bieži sauc par Codd modeli.

    DATU ORGANIZĀCIJA

    Vārds “relation” nāk no angļu valodas attiecības. Lai izskaidrotu “attiecību” matemātisko jēdzienu, atcerēsimies divas definīcijas.

    Dekarta produkts. Lai D1, D2,…D n ir patvaļīgas ierobežotas kopas un ne vienmēr ir atšķirīgas. Šo kopu Dekarta reizinājumu D1 X D2 X … X D n sauc par n-k kopu formā: , kur d1 pieder pie D1, d2 - D2 un d n -D n.

    Apskatīsim vienkāršu piemēru. Lai pirmā kopa sastāv no diviem elementiem D1 = (a1, a2), otrā kopa no trim: D2 = (b1, b2, b3), tad to Dekarta reizinājums ir: D1 X D2 = (a1 b1, a1 b2, a1b3 , a2 b1, a2 b2, a2b3).

    Attieksme. Relācija R, kas definēta kopās D1, D2,…D n, ir Dekarta reizinājuma D1 X D2 X … X D n apakškopa. Šajā gadījumā kopas D1, D2,…D n sauc par relācijas domēniem, bet Dekarta reizinājuma elementus sauc par relācijas kortežiem. Skaitlis n nosaka attiecības pakāpi (aritāti), un korešu skaits nosaka tās kardinalitāti.

    Attiecības ir ērti attēlot tabulu veidā. Šajā gadījumā tabulas rindas atbilst kortežiem, bet kolonnas - atribūtiem. Katrs atribūts ir definēts kādā domēnā. Domēns ir atomu vērtību kopa. Vienā domēnā var definēt vairākus attiecību atribūtus. Atribūts norāda domēna lomu attiecībās.

    Tajā pašā domēnā var definēt arī dažādu attiecību atribūtus.

    Atribūtu, kura vērtības identificē korešus, sauc par atslēgu (atslēgas atribūtu).

    Dažos aspektos kopas tiek identificētas, apvienojot vairāku atribūtu vērtības. Tad saka, ka relācijai ir salikta atslēga. Relācija var saturēt arī vairākas atslēgas. Viena no attiecību atslēgām tiek pasludināta par primāro. Primārās atslēgas vērtības nevar atjaunināt. Visas pārējās attiecību atslēgas sauc par kandidātatslēgām.

    Atzīmēsim svarīgu relāciju datu modeļa iezīmi. Lai gan tīkla un hierarhijas datu modeļos tika izmantotas grupu attiecības, lai atspoguļotu asociācijas starp ierakstiem, šāda koncepcija nepastāv relāciju datu modelī. Lai atspoguļotu asociācijas starp kortežiem relācijā, tiek izmantota to atslēgu dublēšana.

    Atribūtus, kas ir atslēgu kopijas citās attiecībās, sauc par ārējām atslēgām.

    Relāciju atribūtu saraksts un tā īpašības nosaka relāciju shēmu. Divas attiecības sauc par vienu shēmu, ja tās ir veidotas uz vienas shēmas.

    Codd sākotnējais modelis ietvēra nelielu integritātes ierobežojumu kopumu: tas neatļāva korešus ar vienādām primārās atslēgas vērtībām, un tas nodrošināja iespēju noteikt ierobežojumus domēnu vērtībām un līdz ar to arī atribūtiem. Relāciju modelī nav mehānismu asociāciju semantikas uzturēšanai (mēs runājam par integritātes ierobežojumiem, piemēram, iekļaušanas režīmu un dalības klasi). Attiecības pastāv neatkarīgi viena no otras, lai gan dažkārt starp šo attiecību virknēm rodas diezgan sarežģītas asociācijas.

    Integritāti ierobežojošo rīku nepietiekama attīstība kalpoja par stimulu turpmākai Codd modeļa izstrādei, ko sauca par paplašināto relāciju datu modeli. Pēdējā ietver atbalstu vairākām pakalpojumu attiecībām, kurās tiek glabāta informācija par domēnu asociācijām, un lietotāju attiecību apstrādes procedūrās šī informācija tiek ņemta vērā. Extended Codd modelis nodrošina ievērojami uzlabotākus līdzekļus integritātes ierobežojumu atbalstam.

    DARBĪBAS AR DATIEM

    Datu bāzes atjaunināšanas operācijās ietilpst jaunu korežu saglabāšana, nevajadzīgo dzēšana un esošo korežu atribūtu vērtību pielāgošana.

    Operācija INCLUDE prasa norādīt relācijas nosaukumu un provizorisku jaunā kortedža atribūtu vērtību ģenerēšanu. Korpusa atslēga ir jānorāda. Iekļaušana neizdosies, ja atslēgai ir neunikāla vērtība.

    DELETE darbībai ir nepieciešams arī relācijas nosaukums, kā arī dzēšamā koreža un korešu grupas identifikācija.

    Operācija UPDATE tiek veikta nosauktai relācijai, un tā var atjaunināt vienu vai vairākus relācijas korteņus.

    Tālāk mēs apsvērsim attiecību apstrādes pamatoperācijas. Šo operāciju atšķirīgā iezīme ir tāda, ka apstrādes vienība tajās nav korteži, bet gan attiecības. Citiem vārdiem sakot, katras darbības ievade izmanto vienu vai vairākas relācijas, un darbību rezultāts ir jauna relācija.

    Jebkuras relāciju datu bāzes apstrādes nozīme ir vai nu atjaunināt esošās relācijas, vai izveidot jaunas, jo jebkura datubāzes vaicājuma rezultāts nav nekas cits kā jaunas relācijas izveidošana, kas atbilst izlases nosacījumiem.

    SAVIENĪBAS operācijā (C1 = A U B) tiek pieņemts, ka ieejā ir dotas divas vienas shēmas relācijas A un B. Savienības rezultāts ir relācija C, kas konstruēta saskaņā ar vienu un to pašu shēmu, kas satur visus A un visus relāciju korteņus. B. INTERSECTION operācija (C2 = A U B) ieejā pieņem divas vienas shēmas relācijas A un B. Izvadā pēc vienas shēmas tiek izveidota relācija, kas satur tikai tos relācijas A korteņus, kas ir relācijā B.

    Darbība ATŅEMT (C3=A-B). Visas trīs attiecības tiek veidotas pēc vienas shēmas. Rezultātā iegūtā relācija C3 ietver tikai tos korešus no A, kas nav relācijā B.

    Operācija CARTES PRODUCT (C4=A X B). Tās būtiskā atšķirība no iepriekšējām ir tāda, ka attiecības A un B var veidot pēc dažādām shēmām, un relāciju shēmā C4 ir iekļauti visi attiecību A un B atribūti.

    ATLASES darbība (horizontāla apakškopa). Viena relācija tiek izmantota kā operācijas ievade. Atlases rezultāts ir jauna relācija, kas konstruēta saskaņā ar to pašu shēmu un satur sākotnējās relācijas korešu apakškopu, kas atbilst atlases nosacījumiem.

    Operācija PROJECTION (vertikālā apakškopa). Viena relācija tiek izmantota kā operācijas ievade. Iegūtā relācija ietver sākotnējās atribūtu apakškopu. Katram virknes elementam sākotnējā relācijā ir atbilstošs kortežs iegūtajā relācijā tā, ka šo divu kortežu to pašu atribūtu vērtības sakrīt. Bet tajā pašā laikā iegūtās attiecības dublikāti tiek izslēgti, un tāpēc iegūtās attiecības jauda var būt mazāka par sākotnējās attiecības jaudu.

    Darbība CONNECTION. Operācijas ievade izmanto divas relācijas; apzīmēsim tos A un B. Katrā no relācijām tiek izvēlēts atribūts, pēc kura tiks veikts savienojums; Pieņemsim, ka tie ir atribūti A1 un B2). Abiem atribūtiem jābūt definētiem vienā domēnā. Rezultātā iegūtās relācijas shēmā ir iekļauti visi A atribūti un visi relācijas B atribūti. Ir pieļaujams, ka iegūtās relācijas shēmā divu atribūtu vietā, ar kuriem tiek izveidots savienojums, tiek attēlots tikai viens.

    JOIN darbība ir līdzīga Dekarta produktam. Atšķirība ir tāda, ka Dekarta reizinājums ietver katra korteņa no A savienošanu ar katru korešu no B, un savienošanas operācijā kortežs no relācijas A tiek savienots tikai ar tiem kortežiem no B, kuriem ir izpildīts nosacījums: B1 = A1.

    Operācijas DAĻA. Operācijas ievadā tiek izmantotas divas relācijas A un B, lai relācija A, ko sauc par dalāmu, satur atribūtus (A1, A2, ..., Аn). Relācija B – dalītājs – satur atribūtu A apakškopu; liksim (A1,A2, ...,Ak), kur (k

    Ak+1, Ak+2, ..., An.

    Kortežs tiek iekļauts rezultātu relācijā tikai tad, ja tā Dekarta reizinājums ar relāciju B ir ietverts dividenžu relācijā A.

    Relāciju datu modeļa darbības nodrošina iespēju patvaļīgi manipulēt ar attiecībām, ļaujot atjaunināt datu bāzi, kā arī atlasīt uzglabāto datu apakškopas un pasniegt tās vēlamajā formā.

    Mūsu aplūkotās relāciju algebras vai relāciju algebras darbības ļauj soli pa solim aprakstīt iegūtās attiecības iegūšanas procesu.

    Ņemsim vērā relāciju datu modeļa iezīmes:

    Relāciju datu modeļa objektu kopa ir viendabīga - datu struktūra ir definēta tikai attiecību izteiksmē;

    Apstrādes pamatvienība relāciju datu modeļa operācijās ir nevis ieraksts (kā tīkla un hierarhiskajos datu modeļos), bet gan ierakstu kopa - attiecības.

    ATTIECĪBU NORMALIZĀCIJA

    Viena no svarīgākajām problēmām datu bāzes shēmas projektēšanā ir ierakstu veidu (attiecību) identificēšana un to atribūtu sastāva noteikšana. Atribūtu grupēšanai jābūt racionālai, t.i., līdz minimumam samazinot datu dublēšanos un vienkāršojot apstrādes un atjaunināšanas procedūras.

    Sākumā šie jautājumi tika atrisināti intuitīvi. Tomēr intuīcija var pievilt pat pieredzējušam speciālistam, tāpēc Kods relāciju datu modeļa ietvaros izstrādāja ierīci, ko sauc par attiecību normalizēšanu. Un, lai gan normalizācijas idejas ir formulētas relāciju datu modeļa terminoloģijā, tās ir vienlīdz piemērojamas arī citiem datu modeļiem.

    Kods identificēja trīs normālas attiecību formas. Vispilnīgākais no tiem ir trešais. Tiek piedāvāts mehānisms, kas ļauj jebkuru attiecību pārvērst trešajā normālā formā. Šādu pārvērtību procesā var rasties jaunas attiecības.

    Pirmkārt, mēs iepazīstinām ar vienkārša un sarežģīta atribūta jēdzienu. Atribūtu mēs saucam par vienkāršu, ja tā vērtības ir atomiskas, tas ir, nedalāmas. Turpretim kompleksam atribūtam var būt vērtība, kas ir vairāku vērtību sasaiste no viena vai dažādiem domēniem. Sarežģīta atribūta analogi var būt vektors, datu apkopojums vai atkārtots apkopojums.

    Pirmā normālā forma. Relāciju sauc par normalizētu vai reducētu uz pirmo normālo formu (1NF), ja visi tās atribūti ir vienkārši.

    Nenormalizētu attieksmi var viegli normalizēt. Šāda transformācija var izraisīt attiecības kardinalitātes palielināšanos un atslēgas maiņu.

    Funkcionālā atkarība. Lai X un Y ir divi kādas attiecības atribūti. Viņi saka, ka Y ir funkcionāli atkarīgs no X, ja jebkurā brīdī katra X vērtība atbilst ne vairāk kā vienai atribūta Y vērtībai. Funkcionālo atkarību var apzīmēt šādi: X>. Y.

    Pilnīga funkcionālā atkarība. Tiek uzskatīts, ka atribūts bez atslēgas ir funkcionāli pilnībā atkarīgs no saliktās atslēgas, ja tas ir funkcionāli atkarīgs no atslēgas, bet nav funkcionāli atkarīgs no nevienas saliktās atslēgas daļas.

    Otrā normālā forma. Relācija ir otrajā normālā formā, ja tā ir pirmajā normālā formā un katrs bezatslēgas atribūts ir pilnībā funkcionāli atkarīgs no saliktās atslēgas.

    Lai izveidotu saistību ar otro normālo formu, jums ir:

    a) veido savu projekciju, izslēdzot atribūtus, kas nav pilnībā funkcionāli atkarīgi no saliktās atslēgas;

    b) papildus izveidojiet vienu vai vairākas projekcijas saliktās atslēgas daļā un atribūtus, kas ir funkcionāli atkarīgi no šīs atslēgas daļas.

    Transitīvā atkarība. Lai X, Y, Z ir kādas attiecības trīs atribūti. Šajā gadījumā X>Y un Y>Z, bet nav apgrieztās atbilstības, t.i., Z not> vai Y not>X. Tad mēs sakām, ka Z ir transitīvi atkarīgs no X.

    Trešā normālā forma. Relācija ir trešajā normālā formā, ja tā ir otrajā normālā formā un katrs bezatslēgas atribūts ir intransitīvi atkarīgs no primārās atslēgas.

    Relāciju pieejas galvenā priekšrocība ir tās vienkāršība un pieejamība. Lietotāji tiek abstrahēti no atmiņas fiziskās struktūras. Tas ļauj darbināt datubāzi, nezinot tās veidošanas metodes un metodes. Galvenās RMD priekšrocības ir šādas: vienkāršība, datu neatkarība; elastība; neprocedūras vaicājumi, teorētiskais pamatojums, kas balstīts uz relāciju teoriju. Tas ļauj lietotājiem formulēt savus vaicājumus kompaktāk, izmantojot lielākus apkopojumus.

    Kā minēts iepriekš, relāciju datu modelī ir iespējams definēt vienu atribūtu vai vairākus no tiem kā attiecības atslēgu. Šis rekvizīts ļauj ļoti kompakti formulēt datu bāzes vaicājumus, izmantojot relāciju algebras un relāciju skaitļa terminus, kas padara relāciju modeli ļoti vienkāršu lietojumprogrammatūras izstrādātājam.

    No otras puses, visa informācija, kas tiks saglabāta un izmantota IISOD, tiek parādīta tabulu veidā, kas ir raksturīga informācijas pasniegšanas iezīme relāciju datu bāzēs un jo īpaši to dažādajās tabulu datubāzēs.

    DIZAINA MĒRĶI UN UZDEVUMI

    Datu bāzes projektēšanas procesa galvenais mērķis ir iegūt dizainu, kas atbilst šādām prasībām:

    Datu bāzes shēmas pareizība, t.i., datu bāzei ir jābūt modelētās priekšmeta jomas homomorfam attēlam, kur katrs priekšmeta jomas objekts atbilst datiem datora atmiņā, un katrs priekšmeta jomas process atbilst adekvātām datu apstrādes procedūrām. Vienlaikus procesa rezultātiem un atbilstošajām datu apstrādes procedūrām ir jāsakrīt jebkurā darbības laikā, ja to paredz projekts;

    Datorsistēmas konfigurācijas ierobežojumu nodrošināšana, galvenokārt ārējiem un RAM resursiem;

    Darbības efektivitāte, t.i., atbilst prasībām attiecībā uz sistēmas reakcijas laiku uz vaicājumiem un datu bāzes atjauninājumiem;

    Datu aizsardzība pret iznīcināšanu iekārtu atteices dēļ no nepareiziem atjauninājumiem un, ja nepieciešams, no nesankcionētas piekļuves.

    Informācijas sistēmas vienkāršība un lietošanas ērtums;

    Elastīgums, t.i., spēja izstrādāt un pēc tam pielāgot sistēmu izmaiņām mācību priekšmeta jomā un jaunām lietotāju vajadzībām.

    Pirmo četru prasību izpilde ir obligāta projekta akceptēšanai. Pēdējās divas prasības nav obligātas, jo lielāka vai mazāka vienkāršība un lietošanas vienkāršība ir tikai faktori alternatīvu projektu variantu izvērtēšanā.

    DIZAINĒŠANAS PROCESA IETVARS

    Tēmas jomas aptauja. Šajā posmā pēc sākotnējās iepazīšanās ar tematisko jomu seko detalizēts visu tās fragmentu pētījums, no kuriem katram ir raksturīgs vietējais lietotāja attēlojums. Katram fragmentam tiek definēti informācijas objekti, tiek analizēti procesi, kas tos izmanto, un tiek izveidotas skaidras asociācijas starp informācijas objektiem.

    Priekšmeta jomas fragmenti tiek apskatīti secīgi. Turklāt informācija par nākamo fragmentu tiek integrēta ar iepriekšējo fragmentu izpētes laikā iegūto.

    Datu bāzes pārvaldības sistēma ir vissvarīgākā informācijas sistēmas programmatūras sastāvdaļa, kas būtiski ietekmē daudzus sistēmas parametrus, tostarp:

    Lietotāja saskarnes;

    Darbības efektivitāte;

    Lietojumprogrammu izstrādes izmaksas;

    Darbības izmaksas;

    Sistēmas elastība.

    Ārējo ierobežojumu identificēšana. Ārējie ierobežojumi šeit attiecas uz informācijas sistēmas ieviešanas vides ierobežojumiem. Katra ieviešanas vide atšķiras no ideālās. Tas satur daudzus ierobežojumus, starp kuriem mums vissvarīgākie ir tehniskie, programmatūras un organizatoriskie.

    Tehniskos ierobežojumus nosaka datorsistēmas konfigurācija, tās komponentu darbības parametri, to darbības uzticamība utt.

    Programmatūras ierobežojumi galvenokārt attiecas uz operētājsistēmu un lietojumprogrammu programmēšanas valodām.

    Organizatoriskie ierobežojumi ietver prasības attiecībā uz izstrādes laiku un pieejamajiem darbaspēka resursiem. Iespējas apmācīt speciālistus u.c.

    DBVS kandidātu identifikācija. Informācijas sistēmu projektētājam šobrīd ir nodrošināta diezgan liela DBVS izvēle, kas izstrādāta dažādām konfigurācijām un datoru tipiem.

    Šo sistēmu galveno parametru analīze ļauj nekavējoties noraidīt vairākas DBVS, kas acīmredzami nav piemērotas izmantošanai veidojamajā informācijas sistēmā, atstājot vairākas (ne vairāk kā divas vai trīs) kandidātsistēmas turpmākai izskatīšanai.

    DBVS kandidātu izvēli visvairāk ietekmē vairāku ieviešanas vides un DBVS parametru saskaņošana. Šie parametri galvenokārt ietver:

    Datora tips;

    Operētājsistēma;

    RAM apjoms;

    Datorsistēmu konfigurācija un DBVS implementāciju pieejamība vairāku veidu datoriem.

    Datu bāzes modelēšana. Katrai atlasītajai DBVS tiek modelēta datu bāze. Papildus datu struktūras un stratēģijas noteikšanai to glabāšanai iekārtas atmiņā, dizaineris novērtē arī datu bāzes programmatūras vides izstrādes un kopumā informācijas sistēmas ieviešanas un darbības izmaksas.

    Būtībā mēs runājam par priekšmeta apgabala infoloģiskās shēmas pārveidošanu datu bāzes shēmā, ko atbalsta DBVS.

    Modelēšanai ir jāzina izvēlētā DBVS. Ja modelēšanas rezultātā atklājas, ka neviena no izvēlētajām DBVS neļāva iegūt pieņemamu variantu, tad informācijas sistēmai tiek samazināts prasību kopums vai tiek izmantota patstāvīgi izstrādāta uz konkrētu aplikāciju orientēta datu bāzes pārvaldības sistēma. Ja tiek iegūti vairāki pieņemami datu bāzes modeļi, tie tiek pakļauti salīdzinošai analīzei nākamajā projektēšanas posmā.

    Datu bāzes modeļa salīdzinošā analīze. Pirms datu bāzes modeļu salīdzinošās analīzes (un līdz ar to arī DBVS galīgās izvēles) uzsākšanas ir nepieciešams identificēt faktoru kopumu, pēc kura tiks izvērtētas izskatāmās iespējas.

    Nepretendējot uz pilnīgumu, šeit ir saraksts ar visbiežāk izmantotajiem faktoriem datu bāzes modeļu novērtēšanai:

    Nepieciešamais galvenās un diska atmiņas apjoms;

    DBVS vides programmatūras izstrādes sarežģītība;

    Darbietilpīga aplikāciju ieviešana;

    Personāla apmācības izmaksas;

    Ekspluatācijas izmaksas, informācijas sistēma;

    Spēja apvienot datu bāzes izstrādi ar iepriekš pabeigtām programmatūras implementācijām;

    Plānotais informācijas sistēmas ieviešanas laiks.

    Katru faktoru ieteicams kvantificēt. Piemēram, faktoram "spēja apvienot izstrādi ar iepriekš pabeigtām programmatūras ieviešanām" kā kvantitatīvs novērtējums var kalpot par darbaspēka izmaksām atbilstošu programmatūras saskarņu izveidošanai vai atkārtotu programmatūras ieviešanu.

    Īstenošanas dizains. Pēdējais, trešais projektēšanas posms sastāv no diviem soļiem: datu bāzes shēmas projektēšanas, kā arī programmatūras un tehnoloģiju izstrādes informācijas sistēmas uzturēšanai.

    Datu bāzes shēmas projektēšana. Šajā projektēšanas posmā beidzot tiek noskaidroti visi datu bāzes loģiskās un fiziskās organizācijas parametri.

    IP pārvaldības tehnoloģijas attīstība. Tiek izstrādāts tehnoloģisko instrukciju komplekts datu bāzes administratora pakalpojumam. Šīs instrukcijas aptver visu

    procesi, kas tiek veikti informācijas sistēmas ieviešanas un darbības posmos. Vispirms tas:

    Informācijas ievadīšana sistēmā;

    Datu aizsardzība;

    Datu izmantošanas vadība;

    Sistēmas veiktspējas vadība.

    IS pārvaldības tehnoloģiju programmatūra sastāv no servisa rīkiem, kas nepieciešami, lai veiktu lielāko daļu tehnoloģijā iekļauto procesu. Tie var būt standarta programmatūras produkti (no DBVS vai neatkarīgi piegādāti) vai oriģinālas programmatūras izstrādes. Definējot programmatūru, tiek norādīts tās sastāvs, un oriģinālajām programmām tiek izstrādāti to algoritmi.

    INFORMĀCIJAS SISTĒMU UZTURĒŠANAS TEHNOLOĢIJA

    Informācijas ievadīšana sistēmā. Sistēmā glabātā un izmantotā informācija ietver normatīvo un atsauces informāciju lielākajai daļai lietojumprogrammu, kā arī informāciju, kas tiek ievadīta sistēmā, kad lietojumprogrammas tiek izpildītas, tostarp reālajā laikā. Pēdējam informācijas veidam ir raksturīgs īsāks kalpošanas laiks nekā normatīvajai atsauces informācijai. Izglītības iestādes informācijas sistēmā (kā mūsu gadījumā) normatīvā un uzziņas informācija ietver informāciju par skolotājiem, mācību programmām, skolēniem, bet otrais veids ietver informāciju par grafiku, nodarbību apmeklējumu un skolēnu atestāciju. Acīmredzot, ja skolotāju sastāvs, skolēnu saraksti un mācību programmas gada laikā nemainās, tad otrā veida informācija tiek koriģēta katru dienu. Tās ielādi un regulēšanu veic galalietotāji, izpildot funkcionālas lietojumprogrammas.

    Datu aizsardzība. Informācijas sistēmas uzturēšanas tehnoloģijai ir jānodrošina pasākumu kopums dažādu datu aizsardzības aspektu nodrošināšanai. Lai aizsargātu datus no aparatūras kļūmēm un fiziskas iznīcināšanas, tiek izgatavotas datu kopijas un tiek uzturēts žurnālfails. Datu bāzes pašreizējā stāvokļa atjaunošanas programmas izpildes instrukcija ir izstrādāta, lai nodrošinātu datu aizsardzību pret programmatūras kļūmēm un nepareizām izmaiņām.

    Izmantojot DBVS, kurām nav procedūru mehānisma, izstrādātājs programmatūras komplektā var iekļaut sākotnēji izstrādātu pilnīguma pārbaudītāju.

    datu bāzes pareizība. Šāda programma tiks izpildīta intervālā starp datu apstrādes sesijām.

    Pilnīgums un pareizība nozīmē visu ierakstu klātbūtni datu bāzē, bez kuriem lietojumprogrammas nevar normāli darboties. Turklāt tiek pieņemts izveidoto asociāciju pareizība, kā arī to lauku saturs, kas ieviesti, lai atbalstītu dažādas datu atkarības. Šīs programmas algoritms ietver kontroles veidus, kas tiek efektīvi veikti automātiski. Tas atvieglo datu bāzes uzturēšanu un vienkāršo daudzu lietojumprogrammu algoritmus, novēršot apstrādāto datu pareizības pārbaudes procedūras.

    Programmai datu bāzes pilnīguma un pareizības pārbaudei ir jāizstrādā tehnoloģiskās instrukcijas tās ieviešanai un jāprecizē identificēto kļūdu labošanas noteikumi.

    Datu aizsardzība datu bāzē no nesankcionētas piekļuves tiek veikta, izmantojot parastos DBVS rīkus, kā arī piekļuves “kontroles slēdzenes” regulēšanas līdzekļus un kodēšanas-dekodēšanas programmu nomaiņu. Sistēmas darbības stadijā jāizstrādā atbilstoši ieteikumi datu bāzes administratoram.

    Datu lietojuma pārvaldība. Informācijas sistēmas uzturēšanas tehnoloģijai jānodrošina lietotāju un lietojumprogrammu reģistrēšanas mehānisms. Šim nolūkam var izmantot datu vārdnīcas. Turklāt informācija par datu izmantošanu un galalietotāju izsaukumiem informācijas sistēmai jāreģistrē žurnālfailā. Žurnālfailu apstrādes utilītas ļaus datu bāzes administratoram iegūt dažādus datu lietošanas protokolus.

    Darbības stadijā datu bāzes administratoram ir jāizstrādā grafiks lietotāja mijiedarbībai ar sistēmu, lai nodrošinātu normālu informācijas sistēmas darbību un, ja iespējams, izvairītos no konfliktsituācijām.

    Sistēmas efektivitātes pārvaldīšana. Periodiski sistēmas darbības laikā datu bāzes administrators izvērtē tās funkcionēšanas efektivitātes parametrus. Šim nolūkam tiek izmantotas standarta vai sākotnēji izstrādātas servisa programmas, lai iegūtu informāciju par ārējo resursu izmaksām un pieejamību.

    atmiņa, sistēmas reaktivitāte, informācija par datu izmantošanas biežumu utt. Pamatojoties uz šo informāciju, datu bāzes administrators pieņem lēmumus par shēmas parametru maiņu vai reorganizāciju veikšanu.

    SECINĀJUMS

    Termins "relācijas" nozīmē, ka teorija ir balstīta uz matemātisku attiecību jēdzienu. Vārdu tabula bieži lieto kā neformālu sinonīmu terminam “attiecības”. Jāatceras, ka “galds” ir brīvs un neformāls jēdziens un bieži vien nenozīmē “attiecības” kā abstraktu jēdzienu, bet gan vizuālu attiecību attēlojumu uz papīra vai ekrāna. Nekorekta un vaļīga termina “tabula” lietošana vārda “attiecības” vietā bieži vien rada pārpratumus. Visizplatītākā kļūda ir domāt, ka RMD nodarbojas ar “plakanām” vai “divdimensiju” tabulām, ja tādas var būt tikai tabulu vizuāls attēlojums. Attiecības ir abstrakcijas, un tās nevar būt ne “plakanas”, ne “neplakanas”.

    Lai labāk izprastu RMD, jāņem vērā trīs svarīgi apstākļi:

    modelis ir loģisks, tas ir, attiecības ir loģiskas (abstraktas), nevis fiziskas (glabātas) struktūras;

    Relāciju datu bāzēm informācijas princips ir patiess: viss datu bāzes informācijas saturs tiek attēlots vienā un tikai vienā veidā, proti, skaidri norādot atribūtu vērtības relāciju kortos; jo īpaši nav norādes (adreses), kas saistītu vienu vērtību ar citu;

    Relāciju algebras klātbūtne ļauj veikt deklaratīvu programmēšanu un deklaratīvu integritātes ierobežojumu aprakstu, papildus navigācijas (procedūras) programmēšanai un procesuālo nosacījumu pārbaudei.

    LITERATŪRA

    1) http://www.fio.ru/ - Interneta izglītības federācijas vietne.

    2) http://www.citforum.ru/database/foxpro.shtml - materiāli datubāzē

    3) http://db.informika.ru/ - elektroniskais direktorijs

    4) http://www.inftech.webservis.ru/ - Informācijas tehnoloģiju vietne.

    5) www.e-russia.ru - vietne, kas veltīta saturam, problēmām un nepieciešamības pamatojumam ar programmatūras metodēm atrisināt Federālo mērķprogrammu “Elektroniskā Krievija”.

    6) http://ccc.ru/elro/about.html - materiāli par Elektronisko Krieviju: diskusiju centrs.

    7) http://www.e-rus.org/articles/meaning_programm.shtml - programmas “Elektroniskā Krievija” oficiālais teksts

    8) www.hse.ru/~erussia - federālās mērķprogrammas “Elektroniskā Krievija” vietne.

    Anotācija: Šī lekcija iepazīstina ar relāciju datu modeļa pamatjēdzieniem. Šie jēdzieni tiek izmantoti, risinot relāciju datu bāzes projektēšanas problēmu - veidojot relāciju datu bāzes loģisko modeli.

    Informācija, dati, informācijas sistēmas

    Attiecību jēdziens

    - Datu modelis, kura pamatā ir datu attēlošana kā relāciju kopa, no kurām katra ir noteiktu kopu Dekarta reizinājuma apakškopa, un manipulēšana ar tām, izmantojot dažādas relāciju algebras darbības vai... ... ierosināja E.F. Menca 1970. gadā un tagad ir kļuvusi plaši izplatīta un populāra. To veicināja divas tā būtiskās priekšrocības: 1) datu prezentācijas viendabīgums modelī, kas padara tā dizainu viegli uztveramu. datu bāzes lietotājiem, un 2) izstrādātas matemātiskās sistēmas esamība, kas nosaka tās pielietojuma pareizību.

    Pamatā relāciju datu modelis ir attiecību jēdziens, ko nosaka to elementu saraksts un to vērtību saraksts. Apskatīsim piemēru attēlā. 4.1. Tas parāda autobusu grafiku maršrutā "Maskava - Černogolovka - Maskava". Ir noteikta struktūra. Katram grafikā iekļautajam lidojumam ir savs numurs, izlidošanas laiks un ceļojuma laiks. Grafiku var attēlot kā tabulu. Tabulas kolonnu virsrakstus sauc par atribūtiem. To nosaukumu sarakstu sauc par attiecību shēmu. Katrs atribūts nosaka tā attēlojamo datu veidu, ko kopā ar tā vērtību diapazonu sauc par domēnu. Visu tabulu sauc par relāciju, un katra tabulas rinda tiek saukta tuple attiecības. Tādējādi attiecības var attēlot kā divdimensiju tabulu.


    Rīsi. 4.1. Autobusu grafiks maršrutā "Maskava - Černogolovka - Maskava" kā attiecība

    Attiecību jēdziena definēšanas pieejas var būt dažādas. Matemātiski attiecības var definēt kā kortežu kopu, kas ir noteikta apgabalu (domēnu) skaita Dekarta reizinājuma apakškopa. Rezultātā mēs atklājam, ka katrā kortežā ir jābūt vienādam komponentu (atribūtu) skaitam un katra no tām vērtība tiek izvēlēta no kāda noteikta domēna.

    Ieviesīsim vairākas matemātiskas definīcijas, kas saistītas ar attiecību jēdzienu.

    1. definīcija. Dekarta produkts Lai D 1, D 2, ..., D n ir patvaļīgas galīgas kopas, kas ne vienmēr ir atšķirīgas. Šo kopu Dekarta reizinājumu sauc par kopu formā Piemērs:

    Definīcija 2. Attiecību shēma

    Ļaut būt atribūtu nosaukumiem. Relācijas R shēma r ir ierobežota atribūtu nosaukumu kopa

    Definīcija 3. Attieksme

    Attiecība ar shēmu r ierobežotās kopās D 1 , D 2 ,…, D n ir Dekarta reizinājuma R apakškopa

    Sakarības elementus (d 1, d 2, ..., d n), kā minēts iepriekš, sauc par kortežiem. Var teikt, ka katrai relācijai, kas ir Dekarta reizinājuma apakškopa, ir aritāte n. Korejā (d 1 , d 2 , ..., d n) ir n komponenti. Korpusa apzīmēšanai tiek izmantota arī saīsinātā forma d 1, d 2, ..., d n. Dekarta produkta jēdziena izmantošana, lai definētu attiecības relāciju datu modelis padara modeli konstruktīvu. Matemātiskajā valodā tas nozīmē, ka visi pārējie modeļa jēdzieni ir definēti stingri matemātiskas konstrukcijas ietvaros, kuras pamatā ir Dekarta reizinājums.

    Attiecību attēlojuma tabulas forma tika ieviesta, lai popularizētu modeli neapmācītu datu bāzes lietotāju vidū. Relāciju teorijas apstrāde tabulas līmenī slēpj vairākas definīcijas, kas ir svarīgas, lai saprastu, kā relāciju datu bāzu teorijas, un datu manipulācijas valoda, momenti.

    Pirmkārt, dažādu attiecību atribūtus var definēt vienā domēnā, tāpat kā vienas un tās pašas attiecības atribūtus. Tas ir ļoti svarīgs apstāklis, kas ļauj izveidot saikni starp attiecībām pēc nozīmes. Otrkārt, kopai pēc matemātiskās definīcijas nevar būt sakrītoši elementi, un tāpēc relācijas korteņus var atšķirt tikai pēc to komponentu vērtības. Tas ir arī ļoti svarīgs apstāklis ​​modelim: diviem kortežiem nevar būt pilnīgi saskaņoti komponenti. Tādējādi relāciju modelis pilnībā novērš datu dublēšanās par reālās pasaules būtībām! Treškārt, ņemiet vērā, ka attiecību shēma ir arī kopa, kas ļauj strādāt ar tām, izmantojot kopu teorētiskās darbības. Tas ir svarīgs punkts teorijas veidošanai relāciju datu bāzes shēmu projektēšanai.

    Pastāv izteikta atšķirība starp relācijas matemātisko definīciju un faktisko attiecību glabāšanu datora atmiņā. Pēc definīcijas relācijai nevar būt divi identiski korteži. Tomēr DBVS, kas atbalsta relāciju datu modelis, glabā attiecības datoru operētājsistēmu failos. Relāciju ievietošana operētājsistēmas failos ļauj saglabāt identiskus korešus. Ja netiek izmantots īpašs aprīkojums (integritātes uzraudzību veic primārā atslēga), tad parasti lielākā daļa industriālo DBVS ļauj datu bāzē saglabāt divus identiskus korešus.

    No matemātiskā viedokļa iepriekš minētā relāciju modeļa viendabīgums ir tāds, ka relācijas shēma ir nemainīga, citiem vārdiem sakot, katrai tabulas rindai ir vienāds formāts. No otras puses, tiek pieņemts, ka katra tabulas rinda atspoguļo kādu entītiju reālajā pasaulē vai attiecības starp tām. Vai reālās pasaules vienībām tādas ir viendabīga struktūra, ir jautājums, uz kuru jāatbild analītiķim vai pieredzējušam lietotājam. Lēmumu par relāciju modeļa izmantošanas piemērotību datu modelēšanai noteiktā mācību priekšmetā pieņem IT projektu vadītājs un analītiķi.

    Krievijas Federācijas Izglītības ministrija Tadžikistānas Republikas Izglītības ministrija

    Krievu-tadžikistānas (slāvu) universitāte

    "Es un IR" nodaļa

    Kursu darbs

    pēc disciplīnas: Datu bāzes

    par tēmu: - Datu modelis, kura pamatā ir datu attēlošana kā relāciju kopa, no kurām katra ir noteiktu kopu Dekarta reizinājuma apakškopa, un manipulēšana ar tām, izmantojot dažādas relāciju algebras darbības vai... ...

    Dušanbe – 2008. gads


    Plāns

    Ievads

    1 Datu modelis

    2 Relāciju datu modeļa pamatjēdzieni

    3 Vispārīga izpratne par datu modeli

    Secinājums

    Izmantotās literatūras saraksts


    Ievads

    Cilvēce strauji ieiet principiāli jaunā informācijas laikmetā. Ievērojami mainās visas cilvēku dzīvesveida sastāvdaļas. Mūsdienu sabiedrībā informatizācijas līmenis raksturo valsts attīstības līmeni. 21. gadsimta sākumu eksperti dēvē par datortehnoloģiju gadsimtu. To revolucionārā ietekme skar valdības struktūras un pilsoniskās sabiedrības institūcijas, ekonomikas un sociālo jomu, zinātni un izglītību, kultūru un cilvēku dzīvesveidu. Daudzas attīstītās un jaunattīstības valstis ir pilnībā apzinājušās milzīgos ieguvumus, ko sniedz informācijas un komunikācijas tehnoloģiju attīstība un izplatība. Neviens neapšauba faktu, ka virzība uz informācijas sabiedrību ir ceļš uz cilvēces civilizācijas nākotni.

    Saskaņā ar relāciju modeli datu bāze tiek attēlota kā tabulu kopums, kurā var veikt darbības, kas formulētas relāciju algebras un relāciju aprēķinu izteiksmē. Relāciju modelī operācijām ar datu bāzes objektiem ir kopu teorētisks raksturs. Relāciju datu modeļa jēdzieni ir saistīti ar slavenā datu bāzes sistēmu speciālista E. Koda vārdu. Tāpēc relāciju datu modeli bieži sauc par Codd modeli.

    Jebkuras datu bāzes pamatā ir datu modelis. Datu modelis ir datu struktūru, integritātes ierobežojumu un datu apstrādes darbību kopums. Izmantojot datu modeli, var attēlot domēna objektus un attiecības starp tiem.


    1 Datu modelis

    Datu modelis– datu struktūru un apstrādes darbību kopums.

    Datu modeļi ir definēti:

    a) datu kārtošanas veidi.

    b) ierobežojot datu vērtību.

    c) datu operācijas.

    DBVS pamatā ir hierarhiska, tīkla vai relāciju modeļa, šo modeļu kombinācijas vai to apakškopas izmantošana.

    Apskatīsim 3 galvenos datu modeļu veidus: hierarhiskā, tīkla un relāciju.

    Hierarhiskais datu modelis

    a) Hierarhiskā struktūra attēlo elementu kopumu, kas ir savstarpēji saistīti saskaņā ar noteiktiem noteikumiem. Ar hierarhiskām attiecībām savienoti objekti veido virzītu grafiku (apgrieztu koku), kura izskats parādīts 1. attēlā.

    A 1. līmenis

    B1 B2 B3 B4 B5 2. līmenis

    C1 C2 C3 C4 C5 C6 C7 C8 3. līmenis

    Rīsi. 1

    Hierarhiskās struktūras pamatjēdzieni ietver: līmenis, elements (mezgls), savienojums.

    Mezgls ir datu atribūtu kopa, kas apraksta objektu. Hierarhiskā koka diagrammā mezgli tiek attēloti kā grafa virsotnes. Katrs mezgls zemākā līmenī ir savienots tikai ar vienu augstāka līmeņa mezglu. Hierarhiskajam kokam ir tikai viena virsotne (koka sakne), kas nav pakārtota nevienai citai virsotnei un atrodas augšējā (pirmajā) līmenī. Atkarīgie (vergu) mezgli atrodas otrajā, trešajā utt. līmeņi. Koku skaitu datu bāzēs nosaka sakņu ierakstu skaits. Katrs no tiem atrodas otrajā, trešajā dimensijā un atrodas augstākajā 9 pirmajā) līmenī. tieši tas pats. Datu bāzes ierakstiem ir tikai 1 hierarhisks ceļš no saknes ieraksta. Piemēram, kā redzams 1. attēlā ierakstam C4, ceļš iet caur ierakstiem A un B3.

    2. attēlā parādītais piemērs ilustrē hierarhiskas datu bāzes modeļa izmantošanu. Apskatāmajā piemērā hierarhiskā struktūra ir leģitīma, jo Katrs students mācās noteiktā (tikai vienā) grupā, kas pieder noteiktam (tikai vienam) institūtam.

    b) Integritātes ierobežojums- saikņu integritāte starp priekšteci un pēcnācēju, ņemot vērā pamatnoteikumu: neviens pēcnācējs nevar pastāvēt bez priekšteča.

    Piemēri : 1) OKA 3) KOPĀ

    2) INES 4) IMS

    c) Darbības ar datiem:

    Atrodiet norādīto koku.

    Pārvietojieties no viena koka uz otru.

    Pāriet no viena ieraksta uz otru.

    Pārvietojieties no viena ieraksta uz citu, lai šķērsotu hierarhiju.

    Pašreizējā ieraksta dzēšana.


    Institūts (specialitāte, vārds, rektors)


    Rīsi. 3 Datu bāzes tīkla struktūra grafika veidā

    Students ( ierakstu grāmatas numurs, uzvārds, grupa)



    Darbs ( šifrs ,

    uzraugs,

    Rīsi. 4.

    Sarežģītas tīkla struktūras piemērs ir datu bāzes struktūra, kurā ir informācija par studentiem, kas piedalās zinātniskās pētniecības projektos (R&D). Vienam studentam ir iespēja piedalīties vairākos pētniecības projektos, kā arī vairākiem studentiem piedalīties viena pētnieciskā projekta izstrādē. Tīkla struktūras piemēra grafisks attēlojums, kas sastāv tikai no divu veidu ierakstiem, ir parādīts 4. attēlā. Viena saistība attēlo sarežģītas attiecības starp ierakstiem abos virzienos.

    c) Darbības ar tīkla datu modeļa datiem:

    Atrodiet konkrētu ierakstu tāda paša veida ierakstu kopā.

    Pārejiet no augstāka līmeņa mezgla uz pirmo zemāka līmeņa mezglu, izmantojot kādu savienojumu.

    Dodieties uz nākamo mezglu, izmantojot kādu saiti.

    Izveidojiet jaunu ierakstu.

    Iznīcini ierakstu.

    Mainiet ierakstu.

    Iespējot 1 savienojumu.

    Noņemt no saziņas.

    Pāriet uz citu savienojumu.

    Tīkla datu modeļa iezīme: iespēja pārvietoties pa datu savienojumiem, t.i. pāriet no viena ieraksta tipa instances informācijas skatīšanas uz ar ieraksta tipu saistītās instances informācijas skatīšanu. Lietotājam tiek dota iespēja veikt datu bāzes daudzkritēriju analīzi, tieši neformalizējot savas informācijas vajadzības, veidojot vaicājumus DBVS iebūvētajā valodā.

    Vēl viena tīkla datu modeļa priekšrocība ir vairāku datu tipu izmantošana, lai aprakstītu objektu informācijas atribūtus. Tas ļauj izveidot informācijas struktūras, kas attēlo datu tabulas formu Neskatoties uz tīkla datu modeļa attīstību, uz to bāzes nebija iespējams izveidot valodu programmatūru, kas ļautu lietišķajām informācijas sistēmām aprakstīt tīkla organizācijas datus. tāpat.

    Relāciju datu modelis.

    Relāciju jēdziens (angļu relācija) ir saistīts ar slavenā amerikāņu speciālista datubāzu sistēmu jomā E. Codd izstrādnēm.

    2 Relāciju datu modeļa pamatjēdzieni

    Relāciju datu modelis attēlo informāciju kā saistītu tabulu kopumu, ko sauc par relācijām.

    Datu tips– ir līdzvērtīgs datu tipa jēdzienam algoritmiskajās valodās. Ir:

    Veselu skaitļu veidi;

    Reāli tipi;

    Stīgu veidi;

    Datu tipi naudas vērtībām;

    Datu tipi pagaidu daudzumiem;

    Bināro objektu veidi (nav analogu programmēšanas valodās, un to apzīmē ar Blob)

    Mazākā datu vienība relāciju modelī ir viena atomu (nesadalāmu) datu vērtība konkrētajam modelim. Domēns ir tāda paša veida atomu vērtību kopums. Citiem vārdiem sakot, domēns ir derīga potenciāla noteikta veida vērtību kopa. Domēna jēdziens ir vairāk specifisks datu bāzēm, lai gan tam ir dažas analoģijas ar diapazonu veidiem un kopām, kas atrodamas vairākās programmēšanas valodās. Vispārīgākajā formā domēns tiek definēts, norādot kādu bāzes datu tipu, kuram pieder domēna elementi, un patvaļīgu loģisko izteiksmi, kas tiek piemērota datu tipa elementam. Ja šīs Būla izteiksmes novērtējums atgriež patieso vērtību, datu elements ir domēna elements.

    Jāņem vērā arī domēna jēdziena semantiskā slodze: dati tiek uzskatīti par salīdzināmiem tikai tad, ja tie pieder vienam domēnam. Ja divu atribūtu vērtības tiek ņemtas no dažādiem domēniem, tad to salīdzināšanai, iespējams, nav nozīmes. Domēna jēdziens netiek izmantots visās DBVS. Relāciju datu bāzu piemēri, kas izmanto domēnus, ir Oxle un InterBase.

    Atribūti, relāciju shēma, datu bāzes shēma

    Attiecību kolonnas sauc par atribūtiem, un tām tiek piešķirti nosaukumi, ar kuriem tām var piekļūt.

    Relāciju atribūtu nosaukumu sarakstu, kam seko domēnu nosaukumi (vai tipi, ja domēni netiek atbalstīti), sauc par relāciju shēmu.

    Attiecību pakāpe ir tās atribūtu skaits. Pirmās pakāpes attiecību sauc par unāru, otro pakāpi - bināru, trešo pakāpi - trīskāršu,... un pakāpi n - n-āru.

    Datu bāzes shēma ir nosauktu attiecību shēmu kopa.

    Kortežs

    Korpuss, kas atbilst noteiktai relāciju shēmai, ir (atribūta nosaukuma, vērtības) pāru kopa, kas satur vienu katra atribūta nosaukuma atkārtojumu, kas pieder relāciju shēmai. "Vērtība" ir derīga atribūta domēna vērtība (vai datu tips, ja domēna koncepcija netiek atbalstīta). Tādējādi kortedža pakāpe, tas ir, elementu skaits tajā, sakrīt ar atbilstošās relāciju shēmas pakāpi. Citiem vārdiem sakot, kortežs ir noteikta veida nosaukto vērtību kolekcija. Relācijas shēmu dažreiz sauc arī par relācijas galvu, un relāciju kā korešu kopu dažreiz sauc par relācijas pamattekstu. Attiecību shēmas jēdziens atgādina strukturālo datu tipa jēdzienu programmēšanas valodās (struktūra C/C++ valodā, ieraksts Pascal valodā). Tomēr relāciju datu bāzēs relācijas shēmas nosaukums vienmēr ir tāds pats kā atbilstošās instances relācijas nosaukums. Klasiskajās relāciju datu bāzēs, kad datu bāzes shēma ir definēta, tiek modificētas tikai gadījumu attiecības. Tajos var parādīties jauni korteži, un esošie korteži var tikt dzēsti vai modificēti. Tomēr daudzās implementācijās ir iespējams arī mainīt datu bāzes shēmu: definējot jaunas un mainot esošās relāciju shēmas. To parasti sauc par datu bāzes shēmas evolūciju.

    Attiecību atslēgas

    Tā kā relācija no matemātiskā viedokļa ir kopa un kopas pēc definīcijas nesatur sakrītošus elementus, divi relācijas korteži nevar būt viens otra dublikāti jebkurā patvaļīgi noteiktā laika brīdī. Tādējādi relācijai vienmēr ir jāsatur kāds atribūts (vai atribūtu kopa), kas unikāli identificē katru relācijas korešu un nodrošina tabulas rindu unikalitāti. Šo atribūtu (vai atribūtu kopu) sauc par attiecību primāro atslēgu.

    Katrai attiecībai vismaz pilnai tās atribūtu kopai ir unikalitātes īpašība. Tomēr ir jānodrošina arī minimāluma nosacījums. Tāpēc, kā likums, attiecībās vienmēr ir viens atribūts, kam ir unikalitātes īpašība un kas ir primārā atslēga.

    Atkarībā no atslēgā iekļauto atribūtu skaita izšķir vienkāršas un sarežģītas (vai saliktas) atslēgas.

    Vienkārša atslēga ir atslēga, kas satur tikai vienu atribūtu. Kopumā savienošanas darbības ir ātrākas, ja kā atslēga tiek izmantots īsākais un vienkāršākais iespējamais datu tips. No šī viedokļa labākais veids ir vesela skaitļa tips, kuram ir aparatūras atbalsts loģisku darbību veikšanai.

    Sarežģīta vai saliktā atslēga ir atslēga, kas sastāv no vairākiem atribūtiem. Atribūtu kopu, kas ir unikāla, bet ne minimāla, sauc par superatslēgu. Superatslēga ir sarežģīta (salikta) atslēga ar vairāk kolonnu, nekā nepieciešams, lai būtu unikāls identifikators. Šādas atslēgas bieži tiek izmantotas praksē, jo dublēšana var būt noderīga lietotājam.

    Atkarībā no tā, vai atribūts, kas ir primārā atslēga, satur kādu informāciju, izšķir mākslīgās un dabiskās atslēgas.

    Mākslīgā jeb aizstājējatslēga ir atslēga, ko izveido pati DBVS vai lietotājs, izmantojot kādu procedūru, un kura pati nesatur informāciju. Mākslīgo atslēgu izmanto, lai izveidotu unikālus rindu identifikatorus, ja entītija ir jāapraksta pilnībā, lai unikāli identificētu konkrētu elementu. Mākslīgo atslēgu bieži izmanto jēgpilnas kompleksās atslēgas vietā, kas ir pārāk apgrūtinoša, lai to izmantotu reālā datu bāzē. Sistēma uztur mākslīgo atslēgu, taču tā nekad netiek rādīta lietotājam.

    Dabiskā atslēga ir atslēga, kas ietver nozīmīgus atribūtus un tādējādi satur informāciju.

    Katram primārās atslēgas veidam ir savas priekšrocības un trūkumi; Viņu apspriešanai ir veltīts liels skaits publikāciju. Mēs tos nesalīdzināsim sīkāk, bet tikai atzīmēsim katra atslēgas veida galvenos plusus un mīnusus.

    Galvenās dabisko atslēgu priekšrocības ir tādas, ka tās satur ļoti specifisku informāciju, un to izmantošana nerada nepieciešamību pievienot tabulām atribūtus, kuru vērtībām nav nekādas nozīmes un kuras izmanto tikai saziņai starp attiecībām. Citiem vārdiem sakot, dabisko taustiņu izmantošana ļauj iegūt kompaktāku tabulu formu (kurā nebūs lieku, neinformatīvu datu) un dabiskākas attiecības starp tām.

    Galvenais dabisko taustiņu trūkums ir tas, ka to izmantošana ir ļoti apgrūtināta priekšmetu jomas mainīguma gadījumā. Jāsaprot, ka primārās atslēgas atribūtu vērtībām nevajadzētu mainīties. Tas ir, kad korejā ir iestatīta primārās atslēgas vērtība, to vēlāk nevar mainīt. Šī prasība galvenokārt ir paredzēta, lai saglabātu datu bāzes integritāti. Saikne starp attiecībām parasti tiek noteikta tieši ar primāro atslēgu, un tās maiņa novedīs pie šo attiecību pārtraukšanas vai nepieciešamības mainīt ierakstus vairākās tabulās. Pat salīdzinoši vienkāršās datubāzēs tas var radīt vairākas neatrisināmas problēmas. Dažas relāciju DBVS ļauj mainīt primāro atslēgu. Dažreiz tas var būt patiešām noderīgi. Tomēr tas būtu jāizmanto tikai ārkārtējas nepieciešamības gadījumos.

    Tipisks nepastāvīga domēna piemērs, kurā nav iespējams definēt nemainīgu dabisko atslēgu entītijai, ir jebkurš domēns, kurā persona ir entītija. Patiešām, nav iespējams cilvēkam definēt atribūtu kopumu, kas būtu unikāls un nemainīgs visas dzīves laikā.

    Otrs, diezgan būtisks dabisko taustiņu trūkums ir tas, ka unikālās dabiskās atslēgas parasti ir saliktas un satur virknes atribūtus. Kā minēts iepriekš, maksimālais datu operāciju veikšanas ātrums tiek sasniegts, izmantojot vienkāršus veselus skaitļus. Tādējādi no sistēmas veiktspējas viedokļa dabiskās atslēgas bieži vien nav optimālas.

    Abus dabisko atslēgu trūkumus var pārvarēt, definējot attiecībās aizstājējatslēgas, kas ir kāds universāls atribūts, parasti vesela skaitļa tipa, kas nav atkarīgs ne no subjekta domēna, ne, turklāt no relācijas struktūras, ko tā identificē. . Tādā veidā var nodrošināt atslēgas unikalitāti un nemainīgumu (tā kā tā nekādā veidā nav atkarīga no tēmas jomas, tā nekad nebūs jāmaina). Tomēr tas maksā tabulu datu dublēšanu. Jāatzīmē, ka daudzas relāciju DBVS praktiskas ieviešanas ļauj pārkāpt kortežu unikalitātes īpašību starpposma relācijām, kas netieši ģenerētas, izpildot vaicājumus. Šādas attiecības nav kopas, bet gan multikopas, kas dažos gadījumos ļauj sasniegt noteiktas priekšrocības, bet dažkārt noved pie nopietnām problēmām.

    Jebkurai tabulai var būt vairākas atribūtu kopas, kuras var atlasīt kā atslēgu. Šādas kopas sauc par kandidāta vai alternatīvajām atslēgām.

    Bieži attiecībās tiek definētas tā sauktās sekundārās atslēgas. Sekundārā atslēga ir atribūtu kombinācija, kas atšķiras no kombinācijas, kas veido primāro atslēgu. Turklāt sekundārajām atslēgām ne vienmēr ir unikālas īpašības. Definējot tos, var iestatīt šādus ierobežojumus:

    UNIQUE - unikalitātes ierobežojums nevar dublēt sekundāro atslēgu vērtības saskaņā ar šo ierobežojumu;

    NOTNULL — ar šo ierobežojumu nevienam no sekundārajā atslēgā iekļautajiem atribūtiem nevar būt vērtība NULL.

    Atslēgas, kas pārklājas, ir sarežģītas atslēgas, kurām ir viena vai vairākas kopīgas kolonnas.

    Saistītās attiecības

    Relāciju modelī dati tiek parādīti kā savstarpēji saistītu tabulu kolekcija. Šo attiecību starp tabulām sauc par attiecībām. Tādējādi vēl viens svarīgs relāciju modeļa jēdziens ir saikne starp attiecībām.

    Apsverot saistītās tabulas, svarīga ir ārējās atslēgas jēdziens. Apskatīsim to sīkāk.

    Ārvalstu atslēgas attiecības

    Datu bāzēs vieni un tie paši atribūtu nosaukumi bieži tiek izmantoti dažādos veidos. Ārējā atslēga ir vienas attiecības atribūts (vai atribūtu kopa), kas ir citas (vai tās pašas) attiecības atslēga.

    Ārējās atslēgas tiek izmantotas, lai izveidotu loģiskus savienojumus starp attiecībām. Attiecības starp divām tabulām tiek izveidotas, piešķirot vienas tabulas ārējās atslēgas vērtības otras tabulas atslēgu vērtībām.

    Tāpat kā jebkuras citas atslēgas, arī ārējās atslēgas var būt vienkāršas vai saliktas.

    Bieži vien attiecības starp attiecībām tiek izveidotas ar primāro atslēgu, tas ir, vienas attiecības ārējās atslēgas vērtībām tiek piešķirtas citas attiecības primārās atslēgas vērtības. Tomēr tas nav obligāti - parasti savienojumu var izveidot arī, izmantojot sekundārās atslēgas. Turklāt, izveidojot attiecības starp tabulām, nav nepieciešams pieprasīt attiecības noteikšanai izmantotās atslēgas unikalitāti. Ārējās atslēgas atribūtiem nav jābūt tādiem pašiem nosaukumiem kā atslēgas atribūtiem, kuriem tie atbilst. Ārējā atslēga var arī atsaukties uz to pašu tabulu, kurai tā pieder. Šajā gadījumā ārējo atslēgu sauc par rekursīvu.

    Datu integritātes nosacījumi

    Lai nodrošinātu, ka datubāzē glabātā informācija ir nepārprotama un konsekventa, relāciju modelis nosaka noteiktus ierobežojošus nosacījumus. Ierobežojumi ir noteikumi, kas nosaka iespējamās datu vērtības. Tie nodrošina loģisku pamatu pareizu datu vērtību uzturēšanai datu bāzē. Integritātes ierobežojumi palīdz samazināt kļūdas, kas rodas datu atjaunināšanas un apstrādes laikā.

    · Svarīgākie datu integritātes ierobežojumi ir: kategoriskā integritāte;

    Kategorijas integritātes ierobežojums ir šāds. Relāciju korteži apzīmē noteiktu reālās pasaules objektu elementus vai, relāciju DBVS terminoloģijā, kategorijas datu bāzē. Tabulas primārā atslēga unikāli identificē katru korešu un līdz ar to arī katru kategorijas elementu. Tādējādi, lai izgūtu vai manipulētu ar tabulas rindā ietvertajiem datiem, jums jāzina šīs rindas atslēgas vērtība. Tāpēc rindu nevar ievadīt datu bāzē, kamēr nav definēti visi tās primārās atslēgas atribūti. Šo noteikumu sauc par kategoriskas integritātes noteikumu, un tas ir īsi norādīts šādi: neviens rindas primārās atslēgas atribūts nevar būt tukšs.

    Otrais nosacījums nosaka ierobežojumus ārējām atslēgām, lai nodrošinātu datu integritāti, ko sauc par atsauces integritāti.

    Ja divas tabulas ir saistītas, tad tabulas ārējā atslēgā ir jāietver tikai tās vērtības, kas jau ir starp tās atslēgas vērtībām, ar kuru tiek veikta attiecība. Ja DBVS nekontrolē ārējās atslēgas vērtību pareizību, DBVS ir jāatbalsta datu atsauces integritātes ierobežojumi. Lai saglabātu entītijas integritāti, pietiek ar to, ka nevienā saistībā nav korešu ar vienu un to pašu primārās atslēgas vērtību. Runājot par atsauces integritāti, integritātes nodrošināšana šeit ir nedaudz sarežģītāka. Atjauninot atsauces attiecības (ievietojot jaunus korešus vai modificējot ārējās atslēgas vērtību esošajos korežos), pietiek ar to, lai neparādītos nepareizas ārējās atslēgas vērtības. Bet, dzēšot korešu no atsauces relācijas, ir iespējams izmantot vienu no trim pieejām, no kurām katra saglabā atsauces integritāti:

    · pirmā pieeja ir tāda, ka ir aizliegts dzēst virkni, uz kuru pastāv atsauces (tas ir, vispirms ir vai nu jādzēš atsauces korteži vai attiecīgi jāmaina to ārējās atslēgas vērtības);

    · otrajā pieejā, dzēšot atsauces kortei, ārējās atslēgas vērtība visos atsauces koreos automātiski kļūst nedefinēta;

    · Trešā pieeja (ko sauc arī par kaskādes dzēšanu) ir tāda, ka, dzēšot korešu no atsauces relācijas, visi atsauces korteži tiek automātiski dzēsti no atsauces relācijas.

    Nobriedušās relāciju DBVS parasti ir iespējams izvēlēties, kā saglabāt atsauces integritāti katrai atsevišķai ārējās atslēgas definīcijas situācijai. Protams, lai pieņemtu šādu lēmumu, ir jāanalizē konkrētas pielietojuma jomas prasības. Lai gan lielākā daļa mūsdienu DBVS nodrošina atsauces integritāti, tomēr jāatceras, ka ir relāciju DBVS, kas neievieš atsauces integritātes ierobežojumus.

    Attiecību veidi starp tabulām

    Izveidojot attiecības starp divām tabulām, viena no tām būs galvenā (galvenā), bet otrā - pakārtotā (detaļa). Atšķirību starp tām var nedaudz vienkāršot šādi. Galvenajā tabulā vienmēr ir pieejami visi tajā esošie ieraksti. Pakārtotajā tabulā ir pieejami tikai tie ieraksti, kuriem ārējās atslēgas atribūtu vērtība sakrīt ar galvenās tabulas pašreizējā ieraksta atbilstošo atribūtu vērtību. Turklāt galvenās tabulas pašreizējā ieraksta maiņa izraisīs izmaiņas pakārtotās tabulas pieejamo ierakstu kopā, savukārt pašreizējā ieraksta maiņa pakārtotajā tabulā neizraisīs izmaiņas nevienā no tabulām. Praksē bieži vien ir saistītas vairāk nekā divas tabulas. Viena un tā pati tabula var būt galvenā tabula attiecībā pret vienu tabulu un pakārtota tabula attiecībā pret otru. Vai arī vienai galvenajai tabulai var būt nevis viena, bet vairākas pakārtotas tabulas. Tomēr apakštabulu nevar kontrolēt ar divām tabulām. Tādējādi galvenajai tabulai var būt vairāki pakārtoti, bet pakārtotajai tabulai var būt tikai viena primārā tabula.

    Relāciju datu bāzē starp tabulām ir četri attiecību veidi:

    · viens pret vienu - katrs vienas tabulas ieraksts atbilst tikai vienam citas tabulas ierakstam;

    · viens pret daudziem - viens galvenās tabulas ieraksts var atbilst vairākiem pakārtotās tabulas ierakstiem;

    · daudzi līdz vienam vai vairākiem galvenās tabulas ierakstiem var atbilst vienam un tam pašam pakārtotās tabulas ierakstam;

    · daudzi pret daudziem - viens galvenās tabulas ieraksts ir saistīts ar vairākiem pakārtotās tabulas ierakstiem, un viens pakārtotās tabulas ieraksts ir saistīts ar vairākiem galvenās tabulas ierakstiem.

    Atšķirība starp attiecību veidiem viens pret daudziem un daudzi pret vienu ir atkarīga no tā, kura tabula ir atlasīta kā galvenā tabula un kura ir atlasīta kā pakārtotā tabula.

    Attiecību pamatīpašības

    Tagad apskatīsim dažas no vissvarīgākajām attiecību īpašībām relāciju datu modelī.

    3 Vispārīga izpratne par datu modeli

    Datu modeļa jēdzienu var raksturot dažādi. No vienas puses, datu modelis ir veids, kā strukturēt datus, kas tiek uzskatīti par abstrakciju atsevišķi no priekšmeta jomas. Savukārt datu modelis ir instruments priekšmeta jomas konceptuālā modeļa un tā izmaiņu dinamikas attēlošanai datu bāzes formā.

    Ņemot vērā abus iepriekš minētos aspektus, definēsim galvenās datu modeļu struktūras, kas tiek izmantotas, lai attēlotu priekšmeta jomas konceptuālo modeli (entītijas, atribūti, attiecības).

    Datu elements(lauks) – mazākā nosauktā datu vienība. Izmanto, lai attēlotu atribūta vērtību.

    Ieraksts– nosaukta lauku kolekcija. Izmanto, lai attēlotu entītijas atribūtu kolekciju (entītijas ierakstu).

    Ierakstīt gadījumu– ieraksts ar konkrētām lauku vērtībām.

    Agregāts– nosaukta datu elementu kolekcija ierakstā, ko var uzskatīt par vienotu veselumu.

    Fails– tāda paša veida ierakstu gadījumu nosaukta kolekcija. Izmanto, lai attēlotu viendabīgu entītiju kopu.

    Failu komplekts– sistēmā apstrādāto failu nosaukta kolekcija. Izmanto, lai attēlotu vairākas entītiju kopas.

    Ieviesīsim jēdzienu “grupa”, kas vispārina jēdzienus “agregāts” un “ieraksts”.

    Grupa ir nosaukta datu elementu vai datu elementu un citu grupu kolekcija.

    Vissvarīgākais jēdziens konceptuālajā modelī ir attiecību jēdziens starp entītijām (entītiju kopām). Datu modeļos atbilstošo jēdzienu atspoguļo jēdziens “grupas attiecības”.

    Grupas attieksme– nosaukta bināra relācija, kas definēta divās aplūkojamo grupu gadījumu kopās. Pamatojoties uz bināro attiecību raksturu, izšķir 1:1, 1:M, M:1, M:N tipa grupu attiecības. Skaitļu pārus sauc par grupu attiecības koeficientiem. Grupas attiecībās viens grupas dalībnieks tiek noteikts kā attiecību īpašnieks, bet otrs - kā dalībnieks.

    Datu bāze– nosaukta grupu un grupu attiecību gadījumu kolekcija.

    Grupas attiecību attēlošanai tiek izmantotas divas formas:

    A) Graphovaya. Grupas attēlo grafa virsotnes, savienojumus starp grupām attēlo loki, kas vērsti no īpašnieku grupas uz dalībnieku grupu, norādot attiecības nosaukumu un koeficientu.

    Pēc diagrammu veida ir:

    ---------------- hierarhiskais modelis (grafiks bez cikliem - koks);

    ---------------- tīkla modelis (vispārīgi virzīts grafiks).

    b) Tabulveida. Attiecības starp grupām attēlo tabula, kuras kolonnas attēlo atbilstošo grupu atslēgas. Lai formāli aprakstītu tabulu, tiek izmantots relācijas matemātiskais (kopu teorētiskais) jēdziens. Atbilstošo datu modeli sauc par relāciju modeli.

    Datu modelis ir aprakstīts šādi:

    ---------------- tiek noteikti loģisko datu struktūru veidi un raksturlielumi

    (lauki, ieraksti, faili);

    ---------------- aprakstīti noteikumi vispārīgāka tipa konstrukciju sastādīšanai no vienkāršāku tipu konstrukcijām;

    Ir aprakstītas iespējamās darbības ar konstrukcijām un to noteikumi

    nāvessodi, tostarp:

    − elementāras pamatoperācijas ar datiem;

    − vispārinātas operācijas (procedūras);

    − salīdzinoši vienkāršu datu ievades pareizības nosacījumu uzraudzības līdzekļi (ierobežojumi);

    − uzraudzības līdzekļi neatkarīgi no tā, cik sarežģīti nosacījumi noteiktu darbību (noteikumu) pareizai izpildei. Par pamata elementārajām operācijām parasti tiek uzskatītas šādas: ieraksta meklēšana ar doto atslēgas vērtību, vēlamā ieraksta nolasīšana, ieraksta pievienošana, atjaunināšana, dzēšana. Datu modeļi nodrošina arī īpašas darbības, lai izveidotu grupas attiecības.

    Vispārinātās operācijas jeb procedūras ir darbību secība, kas realizē noteiktu datu apstrādes algoritmu. Procedūras var automātiski uzsākt DBVS vai arī tās var palaist lietotājs. Procedūru piemēri ir procedūras datu bāzes kopēšanai, datu bāzes atjaunošanai, procedūras, kas aprēķina noteiktu datu bāzes atribūtu vērtības no citu atribūtu vērtībām utt.

    Kontroles tiek izmantotas, lai īstenotu konceptuālā modeļa integritātes ierobežojumus. Vienkāršākās ierobežojumu vadīklas tiek izmantotas, lai ieviestu gan konceptuālā modeļa ārējos ierobežojumus, gan datu modeļa iekšējos ierobežojumus. Kā pēdējie ierobežojumi īpaši ieviesti neatbilstoša tipa, neatbilstošu raksturlielumu datu ievadīšanas ierobežojumi (pēc bitu skaita, pēc lauku skaita, pēc ierakstu skaita u.c.). Sarežģītāki vadības rīki (noteikumi) ļauj aktivizēt noteiktas darbību secības (neatkarīgi no tā, cik sarežģītas) izpildi, mainot vai pievienojot datu bāzei datus, un tādējādi ieviest integritātes ierobežojumus, kas aprakstīti, izmantojot īpašas konstrukcijas.


    Secinājums

    Kad mēs iepriekšējās sadaļās runājām par relāciju datu bāzu pamatjēdzieniem, mēs nepaļāvāmies uz kādu konkrētu ieviešanu. Šie apsvērumi vienlīdz attiecās uz jebkuru sistēmu, kuras izveidē tika izmantota relāciju pieeja. Citiem vārdiem sakot, mēs izmantojām tā saukto relāciju datu modeļa jēdzienus. Datu modelis apraksta noteiktu vispārīgu jēdzienu un raksturlielumu kopu, kam jābūt visām konkrētajām DBVS un to pārvaldītajām datu bāzēm, ja tās ir balstītas uz šo modeli. Izmantojot datu modeli, varat salīdzināt noteiktas ieviešanas, izmantojot vienu kopīgu valodu. Lai gan datu modeļa jēdziens ir vispārīgs, un mēs varam runāt par hierarhisku, tīkla, kādu semantisku utt. datu modeļiem, jāatzīmē, ka šis jēdziens tika ieviests saistībā ar relāciju sistēmām un visefektīvāk tiek izmantots šajā kontekstā. Mēģinājumi tieši piemērot līdzīgus modeļus pirmsrelāciju organizācijām liecina, ka relāciju modelis tām ir pārāk “liels”, savukārt pēcrelāciju organizācijām tas izrādās “mazs”.


    Izmantotās literatūras saraksts

    1. Datori birojā un mājās: Relāciju datu bāzes: 2004.g. 228 lpp.

    2. Michie D., Džonatons R. Relāciju DBVS. 2004. gads Nr.8, 4.lpp

    3. www.libbooks.ru (2006.–2008. Sadaļa: Datu bāze).

    4. www.bankreferatov.ru (2004.–2008. Sadaļa: Datu bāze).

    5. Džonss E., Satons D. Office 97 lietotājs. / K.: Dialektika, 1999.

    6. Petrovs V.N. Informācijas sistēmas: mācību grāmata augstskolu studentiem, 2003.g. 2. izd. 139. lpp

    Tīkla datu modelis

    SMD elementārie dati un attiecības starp tiem tiek attēloti orientēta tīkla veidā (virsotnes - dati, loki - attiecības).

    Tīkla datu bāzēm bija vairākas priekšrocības:

    · Elastīgums. Vairākas vecāku/bērnu attiecības ļāva tīkla datu bāzei saglabāt datus, kas bija sarežģītāki nekā vienkārša hierarhija.

    · Standartizācija. CODASYL standarta parādīšanās popularizēja tīkla modeli, un tādi minidatoru pārdevēji kā Digital Equipment Corporation un Data General ieviesa tīkla DBVS.

    · Performance. Neskatoties uz to lielo sarežģītību, tīkla datu bāzu veiktspēja ir salīdzināma ar hierarhisku datu bāzu veiktspēju. Kopas tika attēlotas ar norādes uz fizisko datu ierakstiem, un dažās sistēmās administrators varēja norādīt datu grupēšanu, pamatojoties uz attiecību kopu.

    noteikti, tiešsaistes datu bāzēm bija trūkumi. Tāpat kā hierarhiskas datu bāzes, arī tīkla datu bāzes bija ļoti stingras. Iepriekš bija jāprecizē attiecību kopas un ierakstu struktūra. Datu bāzes struktūras maiņa parasti nozīmēja visas datu bāzes atjaunošanu.

    Gan hierarhiskās, gan tīkla datu bāzes bija programmētāju rīki. Lietotāju pieprasījumu īstenošana bieži ievilkās nedēļām un mēnešiem, un brīdī, kad programma bija pieejama, tās sniegtā informācija bieži vien bija bezjēdzīga.

    Uz tīkla modeļa datiem varat veikt nākamie soļi:

    · veikt ierakstu datu bāzē (atkarībā no iekļaušanas veida ierakstu var pievienot grupas attiecībām vai nē);

    · iekļaut ierakstu grupas attiecībās (saistīt ierakstu ar īpašnieku);

    · slēdzis (saistiet pakārtoto ierakstu ar īpašnieka ierakstu tajā pašā grupā);

    · mainīt iepriekš izgūtā ieraksta elementu vērtību;

    · izgūt ierakstu vai nu pēc atslēgas vērtības, vai secīgi grupas attiecībās;

    · dzēst – dzēšot ierakstu, jāņem vērā dalības klases;

    · izslēgt no grupas attiecībām (pārtraukt saikni starp īpašnieka ierakstu un pakārtoto ierakstu).

    Relāciju datu modelis.

    Relāciju modelisir datu bāze, kurā visi lietotājam pieejamie dati ir sakārtoti tabulu veidā, un visas darbības ar datiem tiek reducētas uz darbībām ar šīm tabulām. Attiecību attēlošanas vizuālā forma ir divdimensiju tabula. Tabulā ir rindas (ieraksti) un kolonnas (kolonnas). Katrai rindai ir vienāda struktūra un tā sastāv no laukiem. Tabulas rindas atbilst kortežiem, bet kolonnas atbilst relāciju atribūtiem. Relāciju modeļa priekšrocība ir tā vienkāršība, skaidrība un ērta fiziskā ieviešana datorā. Vienkāršība un skaidrība lietotājam bija galvenais tās izmantošanas iemesls. Šāda veida datu apstrādes efektivitātes problēma izrādījās tehniski diezgan atrisināma. Galvenie trūkumi ir: standarta līdzekļu trūkums atsevišķu ierakstu identificēšanai un grūtības aprakstīt hierarhiskas un tīkla attiecības. Ārvalstu relāciju DBVS piemēri: Visual FoxPro un Access (Microsoft).

    Relāciju modeļa pamatelementi: Attiecības ir vissvarīgākais jēdziens, un tā ir divdimensiju tabula, kurā ir daži dati. Entītija ir jebkura veida objekts, par kuru dati tiek glabāti datu bāzē. Entītijas dati tiek glabāti attiecībās. Atribūti ir īpašības, kas raksturo entītiju. Tabulā tas ir nosaukts un atbilst tabulas kolonnas virsrakstam. Domēns ir visu iespējamo attiecību konkrēta atribūta vērtību kopums. Relāciju shēma (relāciju galva) atribūtu nosaukumu saraksts. Primārā atslēga (attiecību atslēga) ir attiecību atribūts, kas unikāli identificē katru tās karti. Ja korteži tiek identificēti, tikai savienojot vairāku atribūtu vērtības, tad tiek uzskatīts, ka relācijai ir salikta atslēga. Relācija var saturēt vairākas atslēgas. Viena no atslēgām vienmēr ir pasludināta par primāro; tās vērtības nevar atjaunināt. Visas pārējās attiecību atslēgas sauc par kandidātatslēgām.

    Relāciju modeļa priekšrocības:

    Vienkāršība un pieejamība lietotāja izpratnei. Vienīgā izmantotā informācijas konstrukcija ir "tabula";

    Stingri projektēšanas noteikumi, kuru pamatā ir matemātikas aparāti;

    Pilnīga datu neatkarība. Lietojumprogrammas izmaiņas, mainot relāciju datu bāzi, ir minimālas;

    Lai organizētu vaicājumus un rakstītu lietojumprogrammatūru, nav jāzina specifiskā datu bāzes organizācija ārējā atmiņā.

    Relāciju modeļa trūkumi:

    Ne vienmēr ir iespējams priekšmetu jomu attēlot “tabulu” veidā;

    Loģiskā dizaina rezultātā parādās daudzas "tabulas". Tas apgrūtina datu struktūras izpratni;

    Datu bāze aizņem salīdzinoši lielu ārējās atmiņas apjomu;

    Salīdzinoši zems datu piekļuves ātrums.

    Trīs relāciju datu modeļa komponenti:

    § strukturāls

    § manipulatīvs

    § holistisks

    Strukturālā daļa modelis norāda, ka vienīgā datu struktūra ir normalizētā pāru relācija. Attiecības ir ērti attēlot tabulu veidā, kur katra rinda ir kortežs, bet katra kolonna ir atribūts, kas definēts noteiktā domēnā. Šī neformālā pieeja attiecību jēdzienam nodrošina izstrādātājiem un lietotājiem pazīstamāku attēlojuma veidu, kur relāciju datu bāze ir ierobežota tabulu kopa.

    Manipulācijas daļa Modelis definē divus fundamentālos mehānismus datu manipulēšanai - relāciju algebra un relāciju aprēķini. Relāciju modeļa manipulācijas daļas galvenā funkcija ir nodrošināt jebkuras konkrētas relāciju datu bāzes valodas relāciju mēru: valodu sauc par relāciju, ja tā ir ne mazāk izteiksmīga un spēcīga kā relāciju algebra vai relāciju aprēķins.

    Neatņemama sastāvdaļa Modelis nosaka prasības entītiju integritātei un atsauces integritātei. Pirmā prasība ir tāda, ka jebkurai relācijai ir jābūt primārajai atslēgai. Atsauces integritātes prasība jeb ārējās atslēgas prasība ir tāda, ka katrai ārējās atslēgas vērtībai, kas parādās atsauces relācijā, atsauces relācijā ir jābūt kortei ar vienu un to pašu primārās atslēgas vērtību vai arī ārējās atslēgas vērtībai ir jābūt nedefinētai (t.i. neko nenorāda).

    10. Modelis “entity connection” ER-modelis, datu normalizācija.

    ER modelis (Entity-Relationship modelis) ir augsta līmeņa konceptuāls datu modelis, kas tika izstrādāts 1976. gadā, lai vienkāršotu datu bāzes projektēšanas uzdevumu. Entītijas attiecību modeļa pamatjēdzieni ietver entītiju tipus, attiecības un atribūtus.

    ER modelēšanas pamatjēdziens ir entītijas tips, kas attēlo reālās pasaules objektu kopu ar vienādām īpašībām. Entītijas tipu raksturo neatkarīga esamība, un tas var būt objekts ar fizisku (reālu) eksistenci vai objekts ar konceptuālu (abstraktu) esamību.

    Katru unikāli identificējamo entītijas tipa gadījumu vienkārši sauc par entītiju. Katrs entītijas veids tiek identificēts pēc nosaukuma un rekvizītu saraksta, un tas ir klasificēts divos veidos: stiprs un vājš. Vāja tipa esamība ir atkarīga no cita veida, bet stipra tāda nav.

    Lietošanā šķirnes ER modeļa pamatā vairākums modernas pieejas datu bāzu projektēšanai (galvenokārt relāciju). Šo modeli Chen ierosināja 1976. gadā. Domēna modelēšana balstās uz grafisko diagrammu izmantošanu, kas ietver nelielu skaitu neviendabīgu komponentu. Sakarā ar konceptuālo datu bāzes diagrammu izklāsta skaidrību ER modeļi tiek plaši izmantoti CASE- rīki, kas paredzēti relāciju datu bāzu automatizētai projektēšanai.

    Datu struktūras modelēšanai tiek izmantotas ER diagrammas (entity-relationship diagrams), kas vizuāli attēlo attiecības starp entītijām. Saskaņā ar to ER diagrammas ir kļuvušas plaši izplatītas CASE sistēmās, kas atbalsta relāciju datu bāzu automatizētu dizainu. Visizplatītākās ir diagrammas, kas izgatavotas saskaņā ar 1DEF1X standartu, ko izmanto populārākās CASE sistēmas (jo īpaši ERwin, Design/IDEF, Power Designer). ER diagrammas galvenie jēdzieni ir būtība, savienojums Un atribūts.

    Esence

    Esence - tas ir reāls vai virtuāls objekts, kas ir nozīmīgs apskatāmajai jomai, par kuru informācija tiek uzglabāta. Neiedziļinoties detaļās, varam pieņemt, ka entītijas atbilst tabulām relāciju modelī. Katrai entītijai ir jābūt šādām īpašībām:

    1. ir unikāla identifikators;

    Jebkurai entītijai var būt patvaļīgs skaits savienojumu ar citām entītijām.

    ER modeļu diagrammās entītija tiek attēlota kā taisnstūris, kurā ir entītijas nosaukums.