A research on intelligent software development for design and analysis of factorial experiments
Küçük Resim Yok
Tarih
1993
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Ege Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/closedAccess
Özet
ÖZET Bilgisayar Biliminin bir alt dalı olarak kabul edilen Yapay Us (YU) insan gibi düşünüp davranabilen bilgisayar sistemleri yaratmakla ilgilidir. İnsan zekasını benzetmek için matemetiksel mantığı bir araç olarak kullanır. Araştırmacılar YU araç ve tekniklerinden yararlanarak tıp, jeoloji, psikoloji, elektronik, eğitim gibi alanlarda "uzman sistemler" diye isimlendirilen başarılı bilgisayar sistemleri geliştirmişlerdir. Bu sistemler belirli bir alandaki genel bilgiler ve uzmanların özel bilgileri ile donatılmış olup, bu bilgileri o alanda karalar almak ve problemler çözmek için kullanırlar. Burada özel bilgiden kasıt uzmanların yıllar boyu edindikleri deneyimler ile kazanılan sezgilerdir. Bu alanda yapılan çalışmalar uzman sistemlerin başarısının eldeki problemin özellikleri kadar konu bilgisinin sınırları ile de ilgili olduğunu göstermiştir; konu bilgisi dar ve problemler iyi tanımlı olmalıdır. Diğer bir deyişle problem çok çeşitli bilgiyi gerektirmemen' ve problemin çözümü bilinmelidir. Uzmanların bile çözümünü bilmediği problemleri bir bilgisayar sisteminin çözmesi beklenmemelidir. YU'nun başarılı uygulamaları istatistikçileri de daha akıllı istatistiksel yazılımlar geliştirmek için teşvik etmiştir. Bu sistemler yaratılırken bilinen istatistiksel yöntemler "istatistiksel strateji" diye isimlendirilen bir strateji ile bütünleştirilmektedir. Bu çalışmanın temel amacı akıllı istatistiksel yazılımların (AÎY) yaratılmasında karşılaşılan problemleri bulmak, ya mevcut çözümleri geliştirerek veya tamamen yeni çözümler önererek bu problemleri çözmektir. Şimdiye dek İstatistik'te geliştirilen akıllı sistemlerin çoğu veri analizini otomatik hale getirmek üzerinde yoğunlaşmıştır. Veri toplamarında veri analizi kadar önemli olduğu gözönünde bulundurularak bu çalışmada hem veri toplayıp hemde analizini yapabilen bir sistem oluşturulması düşünülmüştür. Pazardaki istatistiksel bilgisayar sistemlerinin diğer bir eksikliği de çoğunun yöntemsel programlama (procedural programming) metodolojisi kullanılarak geliştirilmiş olmasıdır. Bu nedenle bu sistemler kolayca düzeltilip geliştirilemezler. Bu güçlüğün üstesinden gelmek amacı ile bu çalışmada nesneye-yönelik yaklaşım ve mantıksal programlama dili kullanılarak modüler bir sistem oluşturulmaya çalışılmıştır. xxıvBu çalışma özellikle istatistiksel yöntemlerin bilinmeden yanlış kullanımının neden olacağı hasan önlemek açısından önem taşımaktadır. Bunun yanısıra istatistiksel yazılım tasarlama ve geliştirmede kullanılan teknikler açısından da özgündür. Sistem Machintosh bilgisayarında KLISP-STAT (Tierney, 1990) adı verilen istatistiksel kavramlar ve dinamik grafikler için kullanılan nesneye-yönelik ortamda oluşturulmuştur. Sistemin oluşturulmasında kullanılan yöntemler iki grupta toplanabilir, yazılım geliştirme yöntemleri ve istatistiksel yöntemler. Sistem oluşturulurken bilgi benzetimi amacı ile XLISP-STAT'daki "liste" veri yapısı, nesneye-yönelik programlama (NYP) ve üretim sistemleri kullanıldı. İleriye doğru çıkarsama mekanizması Winston ve Horn (1981) tarafından önerilen "stream" ler kullanılarak yaratıldı. Sistemin görsel arayüzü geliştiriliyorken Üçlü Ajan Modeli (Chignell and Hancoock, 1988; Card, 1988) ve Nickerson (1986), Helander (1988), Nelder (1988), Nickerson ve Pew (1990), Tullis'in (1988) önerilerinden geniş olarak yararlanıldı. Yardım modülü Card, Moran and Newell (1983) tarafından önerilen GOMS modeline dayandırıldı. İstatistiksel yöntemler ise Johnson et al. (1987) tarafından önerilen en iyi tasannu belirleme stratejisinin yanısıra tasarım üretimi için Hadamard matrisleri (Diamond, 1981; Raktoe et al., 1981), doğrusal model uyumu, regresyon, hata, varyans, tekrarsız faktoriyel tasarımların analizlerini içermektedir. Sistem istatistiksel veri, faktoriyel tasarımlar, kullanıcı problemine en uygun tasannu belirlemek için yüksek düzeyli stratejiler ve faktoriyel tasarımların üretim ve analizleri ile ilgili düşük düzeyli stratejiler bilgilerine sahiptir. Sistemin konu bilgisi tam, tekrarlı yem, IV, V çözünülürlüklü kesirli faktoriyel denemeler ile sınırlandırılmıştır. Deney sayısı 2n, n=2(l)7 olacak şekilde kısıtlanmıştır. Bu tasarımlar belirli deney sayısında incelenecek olan faktör sayısına göre sınıflandırılmıştır. Deney sayısı ile faktör sayısı birlikte tasarımın çözünülürlüğünü ve böylece tipini belirlerler. Bu çalışmada geliştirilen prototip sistem INDEX/Factor (INtelligent statistical software f ör DEsign and analysis of FACTORial eXperiments) olarak isimlendirilmiştir. Bu sistem, istatistik bilgisi az ve ilgili bir değişken üzerinde etkili olan faktörleri inceleyen XXVendüstri araştırmacılar için geliştirilmiştir. Sistem diyalog- vemenu işletmelidir. Sistemi ağırlıklı olarak bilgisayar yönetir. Sistem tasarım tipi belirleme ve analiz aşamalarında kullanıcıya önderlik eder. Kullanıcı arayüzünün sistemi "kullanılabilir" ve "dost" kılan özellikleri vardır. Böylece, sistemin özellikle istatistikte deneyimsiz kişiler için yararlı olacağı söylenebilir. INDEK/Factor iki oturum halinde çalışır. Birinci oturum problemin tanımlanması, tasarım formülasyonu ve üretimi içindir. İkincisi oturum ise birinci oturumda önerilen plan ile elde edilen verilerin analizi içindir. Sistemin iç yapısı nesnelerle gösterilen alt sistemlerden oluşmaktadır. Bunlar: değişken, belirleme, analiz/yorumlama alt sistemleri ve kullanıcı ara yüzüdür. Bu altsistem ve nesneler çalışır bir sistem yaratmak amacı ile bütünleştirilmiştir. Değişken altsisteminin sorumluluğu faktörler, ilgi değişkenler ve veriyi temsil etmektir. Belirleme alt sisteminin ana amacı ise, veri tabanında kullanıcının kısıtlarını en çok sağlayan tasarımı belirlemektir. Diğer taraftan analiz/yorumlama altsistemi, belirleme altsistemi tarafında önerilen ve kullanıcının onaylandığı tasarımın istatistiksel analizlerini yapar. Bu altsistem aynı zamanda sayısal sonuçlan sözsel ifadelere dönüştürür. Arayüzü ise kullanıcı ile iletişimi sağlayan bir araçtır. Ayrıca kullanıcıya çeşitli yardımlarda bulunan bir yardımı modülü de vardır. Bu çalışmada, nesneye-yönelik tasarım kullanılarak AÎY'ler için bir yazılım modeli geliştirilmiştir. Yaratılan nesneler, nesneler arasındaki kalıtım ilişkisi, bu nesnelerin sorumlulukları, nesneler arası işbirliği ve kontratlar ayrıntılı olarak tamamlanmıştır. Pratik deneyimlerime dayanarak bu tür sistemlerin geliştirilmesinde önemli iki meseleden bahsetmek istiyorum. Bunlardan biri AİY'ler büyük sistemlerdir. Bu nedenle geliştirilmeleri çok uzun zaman almaktadır ve değişik çalışma alanlarından birçok kişinin işe katkıda bulunmasını gerektirmektedir. Bu sistemlerin büyüklüğü nedeni ile yaşabilir bir sistem yaratmak çok zordur. NYP modüller yapıların yaratılmasına olanak tanıdığından dolayı bu sorunun çözümü için ümit vericidir. İkinci önemli meselede istatistiksel stratejilere karar verilmesi ve bu stratejilerin uygulanması için gerekli olan en iyi yöntemlerin bulunmasıdır.. XX VIŞu anda INDEX/Factoriki-düzeyli faktöriyel tasarımların belirlenmesi, üretilmesi ve analizleri için gerekli olan bilgiye sahiptir. Kullanıcıya çeşitli yardımlarda bulunur. Oturumlar boyunca yol gösterin sistemin bir sonraki adımında ne yapacağını ve kullanıcının ne yapması gerektiğini söyler; kullanıcıyı program çalışması esnasında bekleme süresi için uyarır, ayrıca istatistiksel ve işletim sistemi terimlerinin anlamını ve belirli bir arayüz elemanının nasıl işletileceğini açıklar bir sözlüğü de vardır. Bu yüzden el kitabı kullanmaya gerek yoktur. Sisteme ağırlıklı olarak bilgisayar hakim olduğundan dolayı, sorgulama tipi iletişim tercih edildi. lNDEX/Factor tam otomatik bir sistem değildir, sistem öneride bulunur ve kullanıcı sistem tarafından verilen kararlan onaylamalıdır. Sistem ayrıca alternatif tasarımları denemek içinde de imkanı yaratır. Ayrıca birinci oturumun girdi ve çıktılarını tekrar gözden geçirmek için de ortam vardır. Bunun yanısıra, kullanıcı sistemin mantığını sorgulayabilir. Bir başka deyişle, kullanıcı sisteme belirli bir karara nasıl vardığım ve belirli bir gerçeğe niçin ihtiyaç duyduğunu sorabilir. Ayrıca hoş bir veri giriş ortamı sağlar. Kullanıcı istediği zaman sistemden dışarıya çıkabilir. INDEX/Factor'ün kullanıcı girdilerinin tam ve/veya doğru olup olmadığını kontrol eden ek özelliği de vardır. INDEX/Factor'ün analiz altsistemi fonnal veri analizi teknikleri ile donatılmıştır. Bu teknikler gerektiğinde yüksek çözücülüklü istatistiksel grafikler ile desteklenmektedir. Grafik ve analiz sonuçlarının sözsel yorumunda verilmektedir. Yukarıdaki özellikleri ile sistemin deneyimsiz kullanıcılar için çok uygun olduğu söylenilebilir. Buna rağmen, sistem belirli bir endüstri ortamına uyarlanarak geliştirilebilir. Bu yüzden INDEX/Factor'ün istatistiksel yöntemlerden yararlanılmaya çalışıldığı alanın bilgilerini de içeren bir sistemin çekirdeği olabileceği söylenebilir. Aynı alanda geliştirilmiş mevcut diğer istatistiksel yazılımlar ile karşılaştırıldığında INDEX/Factor'ün avantajları vardır. Bunlardan birincisi, INDEX/Factor'ün tasarım tipini otomatik olarak belirlemesidir. Üstüne üstlük değişik tasarımlar denemek ve özelliklerini öğrenmek için ortam yaratır. Bu özelliği ile, sistemin esnek olduğu söylenebilir. Ayrıca, bir sonraki adımda ne yapılacağını açıklayarak ve kullanıcının XX vı" ıdikkatini eksik ve/veya yanlış girdiye çekmek için mesajlar göndererek kullanıcıya önderlik eder. Bu INDEX/Factor'iin en güçlü özelliğidir denilebilir. Geleneksel sistemlerin tersine, INDEX/Factor tümden diyalog- ve menü- işletmeli olarak tasarlanmıştır. Böylece, kullanıcı sisteme birşey yaptırmak için komutları ezberlemek zorunda değildir. Bazı paketlerin anayüzleri ile problemleri vardır. Bunlar çok basit plotlar yaratabilirler; bazıları ise bunları bile yapamaz. Bunun yanına, bazı yazılımlar çok kısıtlı veri analizi yeteneğine sahiptir, bazılarının veri toplama ortamları bile yoktur ve bazıları yorum yeteneğine sahip değildir. Mevcut yazılımların tümünde varolan diğer önemli bir dezavantaj ise kullanıcıdan tekrarsız denemeleri analizi edebilmek amacı ile kullanılan etkilerin normal grafîğinde doğrudan sapan noktaların işaretlemesinin istenmesidir. Tam tersine, INDEX/Factor bu noktalan otomotik olarak seçebilecek analitik yeteneğe sahiptir. Dexter YU teknikleri kullanılarak aynı konumda geliştirilen tek akılb sistemdir. Dexter ve INDEX/Factor'un yaptıkları açısından benzerlikler olduğu halde, bunları nasıl yaptıkları konusunda farklılıklar vardır. ^3u çalışmanın bulgulardan biri nyp ile herhangi bir yazılımı geliştirme avantajları AÎY'leri geliştirmek için de geçerli olduğudur. Geliştirmenin ilk aşamalarında kullanılan yukarıdan-aşağıya yaklaşım geliştiricinin daha ilk dakikadan ayrıntıları düşünmeden ana konularda yoğunlaşmasına yardımcı olur. Sistem genişletilirken, prototip nesneler arasında tanımlanan kalıtım ilişkisi davranışın yeniden tanımlanmasını önler. Bu çalışma NYP'nin hem faktöriyel tasarımları ve hemde istatistiksel veriyi gösterecek kadar esnek olduğunu ortaya çıkarmıştır; bu iki çeşit bilgi nesnelerle gösterildiği zaman kolayca birleştirilebilmiştir. Bu çalışma ayrıca değişik yazılım gösterim çeşitlerinin bütünleştirilmesinin olası ve büyük sistemlerin yaratılmasında faydalı olabileceğini göstermiştir. XXIIIEdinilen tecrübeye dayanarak iş ve kullanıcı özelliklerinin birlikte yaratılan sistemin özelliklerini belirlediği söylenilebilir. Ayrıca uygulama araçları kullanıcının özellikleri, iş, sistemde arzulanılan özellikler ve iletişim şekline bağlı olarak seçilmesi gereklidir. INDEK/Factorti geliştirirken edinilen pratik deneyime dayanarak şunlar önerilebilir: akıllı sistemlerin kullanıcıları çok fazla hareket yapmak zorunda olmamalıdırlar; ekran mümkün olduğu kadar basit ve durağan tutulmalıdır; açıklama ve mesajlar uzun ve karmaşık olmamalıdır; modal diyalogların mesaj yayınlamak amacı ile sık sık kullanılması rahatsız edicidir. INDEX/Factor şimdiye dek geliştirilen yazılımların dezavantajlarının çoğunu yok etmiştir. Tek eksiklik konu bilgisindedir; kayıp gözlemleri işleyemez ve bloklama yapamaz. Fakat bu tür sistemler genelde denenerek gelişirler. Bu nedenle bu araştırmada yaratılan yazılım modelini geliştirmenin kolay olacağı inancındayım. Bu araştırma, sistemi geliştirecek ileri çalışmaları da önermektedir. Sistemin konu bilgisi özellikle IV-çözülürlüklü tasarımlarda iki faktör etkileşimlerinin karışmasından doğan karışıklığın giderilmesi için yararlı olan ek denemelerin önerilebilmesi, kayıp verilerin işlenmesi, bloklama yapılabilmesini sağlayacak şekilde genişletilebilir. Sistem, belirli bir endüstri ortamı bilgisi ile yüklenip o ortam için kullanılabilir hale getirilebilir. EM ger bir olasılık, faktöriyel deneyler konusunda endüstri araştırmacılarının eğitilmesi amacı ile sistemin akıllı eğitim sistemine dönüştürülmesidir. Daha kolay kullanılabilir bir sistem yaratmak için doğal dil arayüzü ve göz-işletmeli kullanıcı arayüz elemanlarından (Jacob 1992) yararlanılabilir. Bu çalışma belirli koşullar altında kullanılabilecek en iyi istatistiksel yöntemlerin belirlenmesi için karşılaştırmalı çalışmalara ihtiyaç duyulduğunu göstermiştir. Bu nedenle, karşılaştırmalı çalışmalar üzerine araştırmalar da bu tür sistemlerin geliştirmesine katkıda bulunacaktır. Son olarak, iyi geliştirilmiş yüksek düzeyli stratejilere de çok ihtiyaç duyulduğu söylenebilir. Uzmanların bilgi mühendisleri ile işbirliği yaparak kendi bilgilerinin kodlanmasına yardımcı olması AlY'ı geliştirenlerin işini daha da kolaylaştıracaktır.xxıv
ABSTRACT In this study, an interdisciplinary research between Computer Science and Statistics has been conducted. The main purpose of this research is to find out specific problems faced in developing intelligent computer software in Statistics, and suggest solutions to these problems. While doing this, alternative solutions have been considered as well as existing solutions have been improved. Later, a prototype system, called INDEX/Factor, for designing and analyzing factorial designs at two-level has been built to explore the validity of these ideas. Two-level factorial designs are particularly useful for the experiments in which too many factors have been involved. For that reason these type of statistical designs are extensively used by industrial researchers for identifying the important factors involved in the production process. INDEX/Factor has been designed by using object-oriented approach. The main reason for this is that, intelligent computer software encapsulate huge knowledge which makes the system implementation, modification and extension very difficult. This approach has features that enable to overcome these difficulties. Another solution to this problem is the integration of different types of knowledge representation which was also successfully applied in developing the prototype system. User interface is another important part of intelligent software. It is known very well that the degree of the intelligence of the system is directly proportional to the intelligence of its user interface. In this system, a user interface has been developed by using exploratory programming methodology. Particular suggestions have also been made depending on the practical experience. In addition, high-level statistical strategies for identifying and analyzing the best factorial design for the research's problem, and low-level strategies for generating designs, fitting linear model, analyzing residuals and unreplicated designs have been developed. The system is well-suited for naive users. It guides throughout the session: it tells what to do and what the system will be doing next. It also has online help facility to explain user xvunknown terms. It is not a full-automatic system but rather "expert guidance embedded type." INDEX/Factor has strengths over existing statistical software in the same domain; it is completely menu- and dialog-driven; it has formalized data analytic techniques; it supports data analysis results with high-resolution statistical graphics; it translates numerical results to verbal statements; it leads throughout the session; its internal structure is powerful enough to be implemented, extended and modified easily. This study suggests further research to improve system's domain knowledge in such a way that it can handle missing observations, blocking and additional runs. Besides, its interface could be improved with the use of natural language interface. Studies for comparing statistical methods and developing high-level statistical strategies could be useful in developing intelligent statistical software. XVt
ABSTRACT In this study, an interdisciplinary research between Computer Science and Statistics has been conducted. The main purpose of this research is to find out specific problems faced in developing intelligent computer software in Statistics, and suggest solutions to these problems. While doing this, alternative solutions have been considered as well as existing solutions have been improved. Later, a prototype system, called INDEX/Factor, for designing and analyzing factorial designs at two-level has been built to explore the validity of these ideas. Two-level factorial designs are particularly useful for the experiments in which too many factors have been involved. For that reason these type of statistical designs are extensively used by industrial researchers for identifying the important factors involved in the production process. INDEX/Factor has been designed by using object-oriented approach. The main reason for this is that, intelligent computer software encapsulate huge knowledge which makes the system implementation, modification and extension very difficult. This approach has features that enable to overcome these difficulties. Another solution to this problem is the integration of different types of knowledge representation which was also successfully applied in developing the prototype system. User interface is another important part of intelligent software. It is known very well that the degree of the intelligence of the system is directly proportional to the intelligence of its user interface. In this system, a user interface has been developed by using exploratory programming methodology. Particular suggestions have also been made depending on the practical experience. In addition, high-level statistical strategies for identifying and analyzing the best factorial design for the research's problem, and low-level strategies for generating designs, fitting linear model, analyzing residuals and unreplicated designs have been developed. The system is well-suited for naive users. It guides throughout the session: it tells what to do and what the system will be doing next. It also has online help facility to explain user xvunknown terms. It is not a full-automatic system but rather "expert guidance embedded type." INDEX/Factor has strengths over existing statistical software in the same domain; it is completely menu- and dialog-driven; it has formalized data analytic techniques; it supports data analysis results with high-resolution statistical graphics; it translates numerical results to verbal statements; it leads throughout the session; its internal structure is powerful enough to be implemented, extended and modified easily. This study suggests further research to improve system's domain knowledge in such a way that it can handle missing observations, blocking and additional runs. Besides, its interface could be improved with the use of natural language interface. Studies for comparing statistical methods and developing high-level statistical strategies could be useful in developing intelligent statistical software. XVt
Açıklama
Bu tezin, veri tabanı üzerinden yayınlanma izni bulunmamaktadır. Yayınlanma izni olmayan tezlerin basılı kopyalarına Üniversite kütüphaneniz aracılığıyla (TÜBESS üzerinden) erişebilirsiniz.
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control, Uzman sistemler, Expert systems, Yapay zeka, Artificial intelligence, Yazılım geliştirme, Software development, İstatistiksel yöntemler, Statistical methods