Browsing by Author "Encadreur: BOUNOUA Abdennacer"
Now showing 1 - 4 of 4
Results Per Page
Sort Options
- ItemDimension reduction methods and artificial learning for the facial pose estimation(2022-02-07) MEKAMI Hayat; Encadreur: BOUNOUA AbdennacerRésumé (en Français) : Cette thèse exploite les avantages de la technologie de fouille de données pour extraire des informations sur la pose de la tête à partir des images du visage dans le but de construire un modèle de classification qui infère l’orientation de la pose de la tête. Notre premier objectif est de montrer l’utilité d’utiliser les techniques de fouille de données symboliques pour classer les poses du visage dans n’importe quel ensemble de données, et donc les distances symboliques efficaces à des fins de classification. Nous avons utilisé des classificateurs classiques tels que Kmeans, KNN, et SVM pour classer les poses du visage de frontale vs de profil. En outre, nous avons abordé le problème des changements d’illumination, nous avons proposé pour surmonter ces problèmes d’effectuer un prétraitement à l’image d’entrée, où nous avons utlisé l’image gradient et l’image traitée avec le Local Binary Pattern (LBP) combiné avec dynamic morphological quotient image (DMQI-LBP), qui sont des descripteurs robustes aux changements d’éclairage. Les résultats de ces expériences ont montré que notre approche est robuste et permet de classifier séparément les poses même dans des conditions dégradées. Pour le deuxième objectif, nous avons suggéré de combiner le privilège de l’apprentissage profond avec une technique de réduction de dimensionnalité assurée par la représentation de série chronologique des images pour apprendre les caractéristiques appropriées pour estimer la rotation de la pose de la tête avec un large plage d’angles (rotation de pan et tilt). Récemment, l’apprentissage profond a vécu un considérable progrès et a atteint des performances exceptionnelles dans le domaine d’estimation de la pose de la tête. Cependant, ces modèles sont coûteux en calcul en raison de la haute dimensionnalité des paramètres et des caractéristiques qui sont calculés lors de l’apprentissage (la dimension des poids est de l’ordre du milliard). La dimension de ces paramètres se progresse proportionnellement à la dimension des données d’entrée. Motivés par cet obstacle, nous avons proposé une approche basée sur l’utilisation de la réduction de dimensionnalité avec les séries temporelles. Notre modèle émule le modèle Sequence-to-Sequence (Seq2Seq), qui est conçu pour les modèles de traduction automatique. Sequence-to-Sequence est un modèle d’apprentissage profond dans lequel l’encodeur encode et apprend la relation entre les mots de la langue source pour la présenter en un vecteur et le décodeur la décode en une séquence de mots dans la langue souhaitée. Ici, les positions des visages sont équivalentes aux positions des mots dans une phrase. Il est donc utile d’analyser les positions des visages en tenant compte du contexte. Pour cette raison, nous sommes motivés par l’utilisation d’un encodeur-décodeur Seq-to-Seq dans notre implémentation. Nous avons construit un classificateur de la pose de la tête appelé SAX-RED, où les séquences symboliques SAX seraient l’entrée de l’encodeur et le décodeur génère les séquences de sortie qui présentent les labels des poses de la tête. Les mots clés : Estimation de la pose de visage, séries temporelles, encodeur-décodeur Abstract (en Anglais) : This thesis leverages data mining technologies to extract head pose information from face images to build a classification model that infers the head pose orientation. To reach this purpose, we propose the SAX2FACE approach, an effortless and efficient alternative solution that relies on a time series dimensionality reduction method (SAX method) to address the problem of head pose rotation. We have mapped face images into a one-dimensional vector as time series using the Peano-Hilbert and Sweep space-filling curves. These numerical series are then converted to symbolic sequences through symbolic aggregate approximation (SAX). Our first objective is to highlight the usefulness of using powerful symbolic data mining techniques to classify face poses in any database, and thus getting effective symbolic distances for classification purposes. We have resorted to classic classifiers such as K-means, KNN, and SVM to classify frontal vs. profile face poses. Besides, we have tackled the illumination changes problem. While we have proposed to overcome these problems by processing the input image with the gradient image and the Local Binary Pattern (LBP) combined with dynamic morphological quotient image (DMQI-LBP), which are robust descriptors to changes in illumination. The results of these experiences have shown that our approach is robust and allows us to separately classify the poses even in degraded conditions. For the second objective, we have suggested combining the expressive power of deep learning with dimensionality reduction technique with time series representation of the images for learning the suitable features to estimate the head pose rotation with a large angles range (in yaw and pitch rotation). Lately, deep learning has witnessed huge progress and has achieved exceptional resorted only to for head pose estimation models. However, it is computationally costly due to the high dimensionality of the parameters and the features that are calculated in training (the dimension of the weights is in the order of the billion). The dimension of these parameters progresses proportionally with the dimension of the input data. Spurred with this obstacle, we propose a new approach based on the use of dimensionality reduction with time series. The model emulates the sequence-to-sequence recurrent neural network that is introduced to deal with Machine Translation (NMT) model. Sequence-to-Sequence is a deep learning model that the encoder recurrent neural network encodes and learns the relationship between words of the source language to present it into a vector, and the decoder decodes it into a sequence of words in the desired language. Here, the positions of the faces are similar to the positions of the words in a sentence. Hence, analysing the positions of the faces by taking into account that the context is useful. This is why we are motivated by the use of Seq2Seq encoder–decoder in our implementation. We built a classifier of the head pose called SAX-RED, where the SAX symbolic sequences would be the input layer of the encoder, and the decoder generates the output sequences which present the labels of head pose. Keywords : head pose estimation, deep learning , symbolic aggregate approximation ,Seq2Seq
- ItemExtraction de contours multirésolution par les transformées géométriques pour le mosaïquage des images médicales(2017-09-26) GHAZ ABDELKRIM; Encadreur: BOUNOUA Abdennacer; Co-Encadreur: Kidiyo KPALMARésumé (Français ) : L’utilisation des images panoramiques est largement répandue dans différents domaines tels que la robotique, la vision par ordinateur et la surveillance. Ces images sont également utilisées en médecine pour éliminer la redondance de l’information contenue dans les clichés des angiographies rétiniennes et de l’endoscopie vésicale. Ainsi elles apportent une aide énorme pour l’ophtalmologiste et l’urologue dans le diagnostic des pathologies de la rétine et de la vessie et permettre le suivi de l'évolution de ces pathologies et de leurs traitements. L'objectif, affiché, de ce travail consiste à l'élargissement du champ visuelle et la création d'une vue globale de la rétine et de la vessie. Pour parvenir à ce but; dans la première grande phase, on applique une décomposition multirésolution NSCT sur l’image originale pour rehausser les contours, dans la deuxième grande phase, on extrait les points clés à l’aide de la technique SIFT pour le calcul de la transformée servant au recalage et à l’assemblage des différentes parties de l'image panoramique. L’extraction des points clés en rehaussant l’image originale par la NSCT et l’application de SIFT ont permis de donner des points d’intérêt plus stables et de diminuer les erreurs de correspondance entre les points des différentes portions d’images à mosaïquer même en présence de fort bruit. Aussi, on a pu corriger les sutures et la différence d’exposition lumineuse entre les images en utilisant le ‘pyramid Blending’ et améliorer la qualité visuelle. Les résultats de mosaïquage obtenus par l'application de l'ensemble des algorithmes développés sur les images angiographiques et cystoscopiques, ont donné des vues panoramiques élargies avec un temps de calcul assez rapide, ce qui offre aux cliniciens un outil d'aide au diagnostic assez fiable. Résumé ( Anglais) : The use of panoramic images is widely used in various fields such as robotics, computer vision and surveillance. It is in particular used in medicine to eliminate redundant information in retinal angiography and vesical endoscopy and help the ophthalmologist and urologist to better detect retinal and bladder pathologies and better follow up the evolution of the pathology and subsequent treatments. To achieve our goal and create a global view of the retina and of the bladder, In a first step, we have applied an NSCT multiresolution decomposition on the original image to enhance the contours. In a second step, we have extracted the key points using SIFT for calculating the registration transform used to assembly the different parts of the panoramic image. The extraction of the key points, when enhancing the original image using NSCT and applying SIFT, has given more stable points of interest and helped reducing mismatches between points of different portions of the images, to be mosaicked, even in the presence of higher noise. In addition, the developed algorithms permit to correct seams as well as the difference in light exposure between images using the pyramid Blending and to improve visual quality. The obtained mosaicking results, by applying all mosaicking processes upon retinal angiography and cystoscopy, are satisfactory in sense of fairly fast computation time for clinicians to use these results in the clinical examination of the patient.
- ItemReconnaissance des formes et classification automatique : Application à l’identification biométrique(2020-06-30) BENKADDOUR Mohammed Kamel; Encadreur: BOUNOUA Abdennacerالملخص (بالعربية) : في الآونة الأخيرة، جذب التعرف البيو متري على الوجه اهتمام المجتمع العلمي. تزداد أهمية تقنية القياسات الحيوية الفعالة وغير التداخلية وغير المتصلة في مجال البحث. أدت التطورات الحديثة في مجال الشبكات العصبية الاصطناعية، والمعروفة الآن باسم التعلم العميق، إلى تحسين الحالة الحديثة في العديد من مجالات التعرف على الأنماط من خلال توفير فرصة لمعالجة المشاكل التي كان من الصعب التعامل معها عن طريق أساليب التعلم الآلي التقليدية. في هذه الأطروحة، نقترح نظام التعرف على الوجوه مع تقنيات التعلم التلقائي ونصف المشاكل الفرعية المحددة مثل استخراج ملامح الوجه واستراتيجية التعلم للشبكات العصبية العميقة. من أجل معالجة هذه المشكلة، نركز على تقنية تسمى الشبكة العصبية التلافيفية (CNN). الهدف من هذه الأطروحة هو تطوير نظام التعرف على الوجوه باستخدام الشبكات العصبية التلافيفية العميقة. في هذا العمل، نقترح طريقة للتعرف على الوجه وتصنيفه على أساس التعلم العميق، وخاصة الشبكة العصبية التلافيفية لاستخراج ملامح الوجه التي اتثبت أنها أداة قوية والتي كانت ناجحة للغاية في تصنيف الصورة والتعرف على الأنماط. تليها آلة ناقلات الدعم (SVM) للتصنيف العالي. لتقليل حجم هذه الميزات، يتم استخدام تقنية تحليل المكون الرئيسي. نجري تقييماً شاملاً لأساليبنا على مجموعة بيانات تقنية التعرف على الوجوه (FERET). أظهرت النتائج التي تم الحصول عليها أن شبكات CNN المرتبطة بتحليل المكونات الرئيسية وحلول SVM، تعمل على تحسين الأداء وكذلك دقة التعرف. الكلمات المفتاحية : القياسات الحيوية ، التعرف على الوجه ، استخلاص المعالم ، الشبكة العصبية التلافيفية FERET,، آلات ناقلات الدعم، SVM ، تحليل المكون الرئيسي. Résumé (en Français) : Récemment, la reconnaissance faciale a suscité l’intérêt de la communauté scientifique. Cette technique de biométrie efficace, non intrusive et sans contact occupe une place de plus en plus importante dans le domaine de la recherche. Les récents progrès dans le domaine des réseaux de neurones artificiels plus connu actuellement sous le nom d’apprentissage profond, ont permis d’améliorer l’état de l’art dans plusieurs domaines de reconnaissance de forme en offrant une possibilité de s’attaquer à des problématiques qui étaient difficilement traitables par les méthodes d’apprentissage automatique conventionnelles. Les travaux effectués dans le cadre de cette thèse portent sur l’identification automatique de visages sur des bases de données d’images numériques. Dans un premier temps, notre approche a consisté à explorer des techniques d’apprentissage automatique et les possibles gains par l’intégration de modèle pré-entrainé de réseaux neurones. Nous décrivons aussi des sous-problèmes spécifiques tels que l’extraction des caractéristiques, la classification et la stratégie d’apprentissage des réseaux de neurones profond pour la reconnaissance de visage. L'objectif de cette thèse est de développer un système de reconnaissance de visage qui combine les réseaux de neurones convolutifs (CNN) avec des approches de classification. Dans ce travail nous proposons une méthode de reconnaissance faciale et de classification basée sur un apprentissage profond, en particulier le réseau neuronal convolutif pour l’extraction des caractéristiques faciale, qui s'avère être un outil puissant qui a connu un grand succès dans la classification des images et la reconnaissance des formes. Afin réduire la dimension de ces caractéristiques, une technique d'analyse en composantes principales est utilisée, suivi par machine à vecteurs de support (SVM) pour une classification plus élevé. Nous avons effectué une évaluation approfondie de nos méthodes sur l'ensemble de données de la technologie de reconnaissance faciale (FERET). Les résultats obtenus ont montré que les réseaux CNNs associés aux solutions d’analyse en composantes principales et de SVM améliorent considérablement les performances ainsi que la précision de la reconnaissance. Les mots clés : biométrie, reconnaissance de visage, extraction de caractéristique, réseau de neurone convolutif, machines à vecteurs de support, FERET, analyse en composantes principale. Abstract (en Anglais) : Recently, face recognition has attracted the interest of the scientific community. This efficient, non-intrusive and non-contact biometrics technique is becoming increasingly important in scientific research. Recent advances in the field of artificial neural networks, now known as deep learning, have improved the state of the art in several areas of pattern recognition by providing an opportunity to tackle problems that were difficult to deal with by conventional machine learning methods. In this thesis, we propose face recognition system on digital image databases, with automatic learning techniques and we describe specific sub problems such as the extraction of faces features, classification and the learning strategy of deep neural networks. In order to address this problem, we are focusing on a technique called Convolutional Neural Network (CNN). The aim of this thesis is to evaluate the problem of face identification using deep convolutional neural networks. In this work we propose a method of facial recognition and classification based on deep learning, in particular the convolutional neural network for the extraction of facial features which proves to be a powerful tool and has been very successful in the field of image classification and pattern recognition. In order to reduce the size of these features, a principal component analysis technique is used, followed by a support vector machine (SVM) for a higher classification. We conduct a thorough evaluation of our methods on the facial recognition technology (FERET) dataset. The results obtained showed that the CNNs networks associated with the principal component analysis and SVM solutions, considerably improve the performance as well as the accuracy of the recognition. Keywords : biometrics, face recognition, feature extraction, convolutional neural network, CNN, support vector machines (SVM), FERET, principal component analysis, PCA.
- ItemTurbo LDPC codes non-binaires associés à des modulations d'ordre élevé(2016-06-21) MOSTARI Latifa; Encadreur: BOUNOUA Abdennacer; Co-Encadreur: TALEB-AHMED AbdelmalikRésumé (Français et/ou Anglais) : Les codes LDPC (Low-Density Parity-Check) binaires ont une capacité s’approchant de la limite de Shannon pour des blocs de donnée de grande taille. Cependant, ces codes ont l'inconvénient d’être moins efficaces pour des blocs de donnée de taille faible ou moyenne. De plus, l’association de codes LDPC binaires avec des modulations d’ordre élevé le rendre aussi moins efficaces. Les codes LDPC non-binaires, définis sur des corps de Galois d’ordre q > 2, permettent de résoudre ces problèmes. Le décodeur LDPC doit fonctionner en décisions douces calculées à l'aide du LLR (Log-Likelihood Ratio) ou de l'APP (A Posteriori Probability) selon le type d'algorithme de décodage utilisé. Le calcul exact de ces décisions pour des modulations d'ordre élevé implique des opérations compliquées. Plusieurs algorithmes ont été introduits afin de simplifier le calcul du LLR pour les codes binaires. Dans ce travail, nous utilisons ces algorithmes pour simplifier le calcul du LLR pour les codes LDPC non-binaires. Ainsi, une méthode pour simplifier le calcul de l'APP est introduite. Elle est programmée afin d’adapter le plus parfaitement possible le système de transmission au type de canal considéré. Cette méthode conduit à simplifier la mise en œuvre du système. Bien que les codes LDPC non-binaires soient de bons codes correcteurs d'erreurs pour un système utilisant une modulation d'ordre élevé, la concaténation des codes LDPC avec un décodage itératif est encore attrayante pour construire des codes correcteurs d'erreurs puissants. Dans ce travail, nous étudions une concaténation de deux codes LDPC binaires, réguliers et identiques, disposés en parallèle à travers la structure turbo-code proposée par Berrou et autres. Ainsi, nous proposons, sous la même structure proposée par Berrou et autres, un nouveau code correcteur d'erreurs appelé turbo LDPC code non-binaire.