XQuery Sebagai Bahasa Integrasi Data

XQuery Sebagai Bahasa Integrasi Data – Kesesuaian bahasa XQuery untuk integrasi data dieksplorasi.

XQuery Sebagai Bahasa Integrasi Data

zorba-xquery – Titik awalnya adalah penilaian kemampuan integrasi dalam lingkungan khusus XML.

Langkah selanjutnya adalah evaluasi sejauh mana seseorang dapat memperluas kemampuan ini ke lingkungan yang heterogen dengan berbagai jenis media dan berbagai protokol akses data.

Ini mengarah pada identifikasi tantangan utama, yang merupakan representasi terstruktur dari format data nonXML menurut item model data XQuery.

Dukungan saat ini untuk representasi tersebut ditinjau, dan basis konseptual diusulkan untuk memodelkan hubungan antara item model data dan contoh format nonXML.

Baca Juga : Kasus Untuk Progam XQuery 

Berbicara tentang integrasi data, kami mengandaikan skenario di mana informasi didistribusikan melalui beberapa sumber daya. Ini mungkin memiliki jenis media yang sama misalnya XML, JSON atau CSV atau jenis media yang berbeda.

Mengenai protokol akses, mereka mungkin disediakan oleh platform yang sama misalnya sistem file, sistem database tertentu, atau HTTP GET atau oleh beberapa platform. Setiap bahasa tujuan umum (Java, C#, Python, Perl) memiliki berbagai API untuk mengakses sumber daya yang diekspos pada platform yang berbeda dan menggunakan jenis media yang berbeda.

Oleh karena itu bahasa tujuan umum apa pun dapat digunakan untuk menyelesaikan tugas integrasi data. Jadi mengapa seseorang harus menetapkan ke bahasa tertentu kualitas menjadi “bahasa integrasi data”?

Aspek kuncinya adalah kesederhanaan. Bahasa yang sangat cocok untuk integrasi data memungkinkan solusi yang sangat sederhana untuk operasi tipikal integrasi data. Singkatnya, ini memungkinkan kesederhanaan ketika berhadapan dengan multiplisitas dan heterogenitas. Kami akan menyelidiki sejauh mana XQuery cocok dengan persyaratan ini. Pertanyaannya relevan dengan peran potensial yang mungkin dimainkan XQuery dalam lanskap TI umum. Jawabannya dapat mengubah pandangan dasar bahasa XQuery tujuan utamanya, ruang lingkupnya, dan arah perjalanan selanjutnya. Jika potensi integrasi data besar, dukungan yang diperluas untuk integrasi data harus menjadi tujuan utama saat menentukan versi XQuery mendatang sebagai standar, serta versi baru prosesor XQuery sebagai produk.

XQuery, dilihat dari luar

Banyak orang tertarik pada integrasi data, tetapi dalam konteks ini kami tidak mengetahui adanya perhatian khusus yang diberikan pada XQuery. Perasaan umum tampaknya bahwa XQuery adalah bahasa khusus untuk mengekstraksi konten dari dokumen XML. Ketertarikan pada fungsionalitas seperti itu sangat berkurang oleh fakta bahwa di banyak lingkungan, dokumen XML tidak ditangani secara langsung, karena disembunyikan oleh alat dan teknologi. Misalnya, banyak layanan web (REST dan SOAP) menggunakan dan menghasilkan XML, tetapi pengembang aplikasi klien dan server biasanya menangani objek (misalnya objek JAXB), daripada dokumen pesan itu sendiri. Akibatnya, XQuery memiliki status bahasa khusus yang menawarkan dukungan untuk tugas yang tidak biasa.

Fakta dasar tentang XQuery

Integrasi data berkaitan dengan pemilihan informasi dari berbagai sumber daya dan heterogen, menggabungkan dan mengubahnya menjadi informasi baru, yang dikirim ke komponen perangkat lunak penerima atau disimpan dalam sumber daya multipel dan heterogen. Persyaratan ini harus digunakan sebagai latar belakang saat mempertimbangkan beberapa fakta dasar tentang XQuery.

XQuery sebagai bahasa berorientasi informasi

XQuery adalah bahasa yang berfokus pada ekspresi informasi dalam dua cara sebagai pilihan informasi yang ada, dan sebagai konstruksi informasi baru. Pemilihan dan konstruksi informasi adalah operasi kunci dari integrasi data

XQuery sebagai bahasa yang ramah agregasi

Model data dibangun di atas abstraksi kunci dari urutan item, bukan pada satu item. Akibatnya, banyak operasi dapat diterapkan pada urutan item, bukan hanya pada item individual; khususnya, ekspresi jalur dapat diterapkan ke sejumlah dokumen input “secara bersamaan”. Pemrosesan kumpulan sumber daya yang digabungkan adalah operasi kunci dari integrasi data

Memperluas cakupan akses sumber daya

XQuery 1.0 membatasi akses sumber daya ke sumber daya XML yang diidentifikasi melalui satu URI (dalam praktiknya file, entri database XML, dan dokumen yang dapat diambil melalui HTTP GET dan ftp)

XQuery 3.0 memungkinkan pembacaan sumber teks

XQuery 3.1 memungkinkan penguraian teks JSON menjadi representasi terstruktur

Fungsi ekstensi khusus vendor memperluas cakupan akses sumber daya lebih lanjut (mengurai CSV, membaca konten arsip, akses ke database SQL dan NoSQL, dukungan untuk pesan HTTP POST)

Akses ke berbagai platform data dan jenis media merupakan prasyarat integrasi data

Integrasi data XML

Bagian saat ini berfokus pada skenario di mana semua sumber daya yang relevan adalah dokumen XML. Pengaturan ini menyembunyikan tantangan khusus pemrosesan data nonXML dengan bahasa XMLsentris, serta tantangan umum dalam menangani format data yang heterogen. Tujuan kami adalah untuk menyoroti kemampuan XQuery untuk menangani informasi terstruktur yang didistribusikan melalui beberapa sumber daya. Kemungkinan untuk menjaga kemampuan ini dalam konteks yang lebih umum ketika berurusan dengan data nonXML dan berbagai format akan dieksplorasi setelahnya( bagian yang disebut “Akses sumber daya” dan bagian yang disebut “pengikatan XDM” ). Terlepas dari jenis media yang terlibat, beberapa operasi cenderung penting dalam konteks integrasi data

Eksplorasi sumber daya mengumpulkan informasi tentang sumber daya yang tidak diketahui atau sedikit diketahui

Validasi sumber daya menilai kesesuaian sumber daya dengan harapan

Mencari informasi

Sebelum data dapat diintegrasikan, mereka harus ditemukan dan ditangani secara selektif.

Navigasi massal

Meskipun navigasi sering diterapkan pada dokumen tunggal, navigasi tidak dibatasi untuk penggunaan lokal seperti itu. Langkahlangkah dari suatu jalur tidak harus merupakan langkah sumbu (seperti pada contoh sebelumnya), tetapi dapat berupa ekspresi arbitrer, asalkan hanya menghasilkan node (dalam kasus langkah nonterminal) atau hanya node atau hanya nilai atom (dalam kasus langkah terminal). Secara khusus, sebuah langkah dapat menghasilkan node yang berisi beberapa dokumen. Misalnya, ungkapan

Validasi sumber daya

Integrasi data sering melibatkan validasi sumber daya terhadap harapan. Laporan validasi mungkin menjadi tujuan utama dalam dirinya sendiri, dan pengecualian sumber daya yang tidak valid dari pemrosesan lebih lanjut mungkin diperlukan untuk memastikan integritas data, ketahanan operasional, dan efisiensi.

Validasi skema

Pustaka fungsi standar XQuery belum berisi fungsi apa pun untuk memvalidasi dokumen XML terhadap skema XSD. Sebagai fitur opsional, bahasa XQuery tidak menyertakan validateekspresi, yang mengembalikan salinan dokumen yang divalidasi dengan anotasi tipe yang ditambahkan, atau memunculkan kesalahan jika terjadi kesalahan validasi. Dua poin harus diperhatikan. Pertama, tujuan untuk mengumpulkan informasi tentang validitas berbeda dari tujuan untuk membuat dokumen beranotasi tipe, dan tujuan pertama yang umum, bukan tujuan yang terakhir. Kedua, implementasi darivalidate ekspresi tidak umum di antara prosesor XQuery populer, terutama di antara produk open source. Kami berpikir bahwa fungsi XQuery yang menawarkan validasi XSD diinginkan secara umum, dan sangat diinginkan dalam konteks integrasi data. Untuk saat ini, beberapa prosesor XQuery menawarkan fungsi ekstensi khusus vendor untuk validasi XSD dokumen XML.

Validasi skema massal

Tanda tangan khas dari fungsi ekstensi untuk validasi XSD memiliki dua parameter, satu menyediakan dokumen instans dan satu lagi memasok dokumen skema. Menariknya, tanda tangan semacam itu cukup untuk mengaktifkan validasi massal validasi banyak dokumen instans terhadap kumpulan skema kandidat, menerapkan dokumen skema yang sesuai ke setiap dokumen instans dan mengintegrasikan hasilnya ke dalam satu laporan. Kemudahan mencapai ini mengikuti dari kemampuan navigasi dan keramahanagregasi XQuery :

untuk dokumen contoh tertentu pilih skema yang sesuai dengan mencocokkan namespace dan nama lokal elemen root dokumen dengan namespace target skema dan nama deklarasi elemen tingkat atas

kumpulkan hasil validasi dokumen tunggal dalam ekspresi FLWOR sederhana

mengintegrasikan hasil validasi dokumen tunggal menggunakan ekspresi yang disematkan

Facebooktwitterredditpinteresttumblr