L’apprentissage profond pour le traitement d’images
Loading...
Date
2020-12-23
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
الملخص (بالعربية)
الرؤية الحاسوبية هي أحدى مجالات علم الحاسوب التي تمكن الأنظمة الأوتوماتيكية بالتعرف على المعطيات المرئية (الصورة والفيديو). تستخدم هذه الأنظمة عادة لاداء مهام التوصية. في السنوات الأخيرة, تزايد كمية البيانات الرقمية ساهم بشكل كبير في الإهتمام المتزايد بأنظمة الرؤية الحاسوبية وذلك لمعالجة هذه الكمية المعتبرة من المعلومات وتسهيل إستخراج المعارف المهمة منها.
تعتمد أنظمة الرؤية الحاسوبية بشكل أساسي على طرق تعلم الآلة وطرق التعلم العميق. في السنوات الأخيرة, ساهمت الكميات المعتبرة من المعلومات ووحدات معالجة الرسوميات القوية في تشجيع الباحثين على إستغلال طرق التعلم العميق. تتميز هذه التقنيات بأدائها الجيد على الكميات المعتبرة من البيانات, إضافة إلى ذلك, تتميز أيضا بقدرتها على الإستخلاص الأوتوماتيكي للميزات من البيانات الغير المنظمة, مثل الصور. أستخدمت طرق التعلم العميق في العديد من التطبيقات في مجال الرؤية الحاسوبية وذلك من أجل أداء مهام مختلفة مثل التصنيف, الكشف, وتقسيم الصور الرقمية.
في هذه الأطروحة, وجهنا إهتمامنا بشكل خاص لإستخدام صنف خاص من خوارزميات التعلم العميق من أجل تصنيف الخصائص النسيجية للصور. في هذا السياق, إقترحنا العديد من الطرق من أجل معالجة مختلف المشاكل المتعلقة بتطبيق طرق التعلم العميق لمعالجة هذه الصور. تعتمد التقنيات المقترحة بشكل رئيسي على تقنيات التنظيم, التعلم الجماعي, ونقل التعلم. طرق التعلم الجماعي تساعد على حل مختلف المشاكل المتعلقة بالتباين المرتفع, التحيز, والتأثر المعتبر لطرق التعلم العميق بتغير البيانات. من ناحية أخرى, طرق نقل التعلم تستخدم من أجل حل مشاكل طرق التعلم العميق على الكميات المحدودة من البيانات.
الكلمات الرئيسية:
الرؤية الحاسوبية, طرق التعلم العميق, خوارزميات التعلم العميق, الخصائص النسيجية للصور.
Résumé (en Français) :
La vision par ordinateur est un champ d’étude qui permet aux systèmes automatiques à reconnaitre les entrées visuelles pour les exploiter dans des tâches de recommandation. Dans ces dernières années, la quantité des images et des vidéos a largement augmenté. L’exploitation des systèmes de vision par ordinateur pour l’analyse de cette quantité d’informations devient importante afin d’extraire de l’information pertinente.
Les systèmes de vision par ordinateur sont basés essentiellement sur les méthodes d’apprentissage automatique (ML) et d’apprentissage profond (DL). Avec l’augmentation de la quantité de données et la disponibilité du matériel puissant, les méthodes DL ont connu un grand intérêt en raison de leur bonne performance sur les grands volumes de données et leur capacité d’extraction de caractéristique dans le cadre des données non structurées. Ces techniques étaient exploitées dans différents sous domaines en vision par ordinateur pour effectuer plusieurs tâches : classification, localisation, détection, et segmentation.
Dans le contexte de la présente étude, nous nous intéressons à la classification des images histopathologiques par les méthodes DL, précisément par les réseaux de neurones convolutifs (CNN). Dans ce cadre, nous avons proposé plusieurs approches pour répondre aux différents problèmes liés à l’application des techniques DL en classification de ce type d’images.
Les approches proposées sont basées essentiellement sur les techniques de régularisation, les méthodes ensemblistes, et les stratégies d’apprentissage transféré et de fine tuning.
Il est intéressant de noter que les méthodes ensemblistes sont exploitées afin de résoudre les différents problèmes liés à la variance élevée, le sur-apprentissage, et la sensibilité des réseaux DL au changement de données. En plus, elles permettent de combiner les prédictions de plusieurs modèles, et cela génère des décisions plus robustes et stables au changement de données. D’autre part, les techniques d’apprentissage transféré et de fine tuning sont utilisés afin de résoudre le problème de sur-apprentissage sur les volumes limités de données.
Les mots clés : vision par ordinateur, apprentissage profond, réseaux de neurones convolutifs, images histopathologiques.
Abstract (en Anglais) :
Computer vision is defined as a field of computer science that enables automatic systems to identify visual inputs. These systems are usually used to perform recommendation tasks. In recent years, the amount of digital data, such as images and videos, have largely increased. In this regard, the exploitation of computer vision systems became essential to maintain these volumes and also to extract relevant information.
Computer vision systems are based on machine learning (ML) and deep learning (DL) methods. Many factors, such as the growing volumes of data and the availability of powerful graphical processing units (GPU) have encouraged the computer vision community to exploit DL methods. These techniques are characterized by their efficiency on large volumes of data and also by their capacity to extract features from non-structured data. DL methods have been exploited in different applications in computer vision to perform several tasks: classification, localization, detection, and segmentation.
In this study, we are particularly interested in the classification of histopathological images by convolutional neural networks (CNN). In this context, we have proposed several pipelines to solve the different issues related to the application of DL methods on these types of images. The proposed frameworks are based mainly on regularization methods, ensemble learning techniques, and transfer learning and fine-tuning strategies. We should note that ensemble learning techniques are used to solve the different issues related to the high variance, overfitting, and the sensevity of neural networks to data changes. On the other hand, transfer learning and fine-tuning strategies are used to solve the overfitting problem on limited volumes of data.
Keywords : Computer vision, deep learning, convolutional neural networks, histopathological images.
Description
Doctorat