A NEW METHOD FOR SOFTWARE DEFECT PREDICTION BASED ON OPTIMIZED MACHINE LEARNING TECHNIQUES

thumbnail.default.placeholder
Date
2022-03-01
Authors
HASSEN, SHAHO ISMAEL HASSEN
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
In this thesis a novel and robust heuristic driven neuro-computing model was developed for software defect prediction. Unlike other classical machine learning models, neuro-computing, especially Levenberg Marquardt Neural Network (LM ANN), is considered to be more robust in terms of adaptive learning, which can be vital towards non-linear feature learning and hence defect data. However, similar to the other machine learning models, the likelihood of local minima and convergence could not be avoided due to exceedingly high weight estimation for 17 input features. Considering this fact, this research contributed a novel improved genetic algorithm, say heuristic model was developed to assist ANN for adaptive weight estimation and update during learning. Here, the key purpose of heuristic model was to help LM-ANN gaining superior weight estimation, update and hence learning without undergoing any local minima and convergence problem. This as a result helped the proposed neuro computing model to achieve higher accuracy than the classical neural network over targeted software fault datasets. In addition to the classifier or machine learning improvement, in this research the focus was made on feature engineering as well that helped alleviating any probability of class imbalance, over-fitting and convergence.
Description
OPTİMİZE EDİLMİŞ MAKİNE ÖĞRENİM TEKNİKLERİNE DAYALI YAZILIM KUSURLARINI ÖNGÖRMEK İÇİN YENİ BİR YÖNTEM
ÖZ: Bu tezde, tüm gerçekleri motivasyon olarak kabul ederek yazılım kusur tahmini için yeni ve sağlam bir buluşsal güdümlü nöro-bilgisayar modeli geliştirilmiştir. Diğer klasik makine öğrenimi modellerinden farklı olarak, nöro-bilgisayar, özellikle Levenberg Marquardt Sinir Ağı (LM-YSA), doğrusal olmayan özellik öğrenimi ve dolayısıyla hatalı veriler için hayati önem taşıyabilecek uyarlamalı öğrenme açısından daha sağlam olarak kabul edilimektedir. Ancak, diğer makine öğrenimi modellerinde olduğu gibi, 17 giriş özelliği olanlarda da aşırı yüksek ağırlık tahmini nedeniyle yerel minimum ve yakınsama olasılığından kaçınılamamıştır. Bu gerçeği göz önünde bulundurarak, bu araştırma, öğrenme sırasında uyarlanabilir ağırlık tahmini ve güncelleme için YSA'ya yardımcı olamak amacıyla buluşsal model denilen yeni bir geliştirilmiş genetik algoritm sunark katkıda bulunmuştur. Burada buluşsal modelin temel amacı, LM-YSA'nın herhangi bir yerel minimum ve yakınsama sorunu yaşamadan üstün ağırlık tahmini, güncelleme ve dolayısıyla öğrenme elde etmesine yardımcı olmaktır. Sonuç olarak , önerilen nöro-bilgisayar modelinin hedeflenen yazılım hatası veri kümeleri üzerinde klasik sinir ağından daha yüksek doğruluk elde etmesine yardımcı olmuştur. Sınıflandırıcı veya makine öğrenimi iyileştirmesine ek olarak, bu araştırmada, herhangi bir sınıf dengesizliği, aşırı uydurma ve yakınsama olasılığının hafifletilmesine yardımcı olan özellik mühendisliğine de odaklanılmıştır.
Keywords
computer engineering
Citation