Séminaire étudiants IV


mercredi 29 mai 2024 - Séminaires

Le lien vers l’enregistrement se trouve ici (durée : 1 heure et 40 minutes).

Heure et date : le 29 mai 2024 à 11h30
Lieu : PK-4610 et Zoom

11h30 – 12h00

Conférencier : Lokman Saleh
Titre : Développement d’un cadriciel pour l’apprentissage automatique.

Résumé : Grâce à ses résultats spectaculaires dans des tâches de traitement numérique de l’information digitale telles la reconnaissance des formes, le regroupement ou la régression, l’apprentissage automatique a gagné beaucoup en popularité dans des domaines aussi variés que la médecine (reconnaissance de tumeurs cancéreuses), les véhicules autonomes (vision automatique), la gestion de trafic (routier ou dans un réseau de télécommunications) et le marketing (gestion de l’expérience client). Cependant, le bon usage des techniques d’apprentissage machine pour la résolution de problèmes métiers est complexe, et nécessite la collaboration entre une personne spécialiste du domaine d’application (par ex. médecine ou marketing) et une personne spécialiste en apprentissage machine, et ce, pour, minimalement: 1) traduire le problème métier en une tâche d’analyse de données; 2) choisir la bonne chaîne de traitement, en fonction de la tâche d’analyse et des caractéristiques des données en question; 3) choisir les bons algorithmes et techniques pour chaque étape de la chaîne de traitement; 4) appliquer la chaîne en question sur les données du problème; et 5) interpréter les résultats pour répondre à la question métier initiale. Le but de cette recherche est d’explorer la mesure dans laquelle l’essentiel de l’expertise en sciences de données, nécessaire pour résoudre les problèmes communs en analyse de données, peut être capturée dans un cadre logiciel qui aidera un analyste métier (médecin, ingénieur réseau, analyste marketing) à obtenir une solution raisonnable-pas nécessairement optimale-à son problème. Pour ce faire, nous proposons de recenser et formaliser les connaissances et les bonnes pratiques sous-jacentes à la résolution de problèmes communs en analyse de données, et les opérationnaliser dans une chaîne d’outils. Notre résultat a été un outil d’aide, incrémental, opérationnalisant les trois premières étapes mentionnées ci-dessus.

12h00 – 12h30

Conférencière : Alexandra Lapointe
Titre : Automatisation de la mesure fonctionnelle à partir d’artéfacts Devops

Abstract : Contexte. Les mesures de taille fonctionnelle sont une entrée essentielle dans l’estimation de projet de développement. Bien que matures à travers 5 normes ISO, les mesures de taille fonctionnelles sont peu appliquées. Les exigences logicielles étant souvent mal définies et ambiguës, cela rend la mesure de taille fonctionnelle difficile ou beaucoup plus coûteuse dansces cas. Ce projet regarde la problématique de la faible utilisation des mesures de taille fonctionnelles à partir des exigences logicielles comme outil d’estimation pour les systèmes d’information (SI). Objectif. Le projet de thèse consiste à explorer des mécanismes d’automatisation de la mesure de taille fonctionnelle des SI dans un cadre DevOps afin de rendre la mesure davantage disponible et à moindre coût. Les exigences logicielles seront utilisées comme artefact d’entrée à l’automatisation afin d’obtenir une mesure de taille fonctionnelle plus tôt dans le cycle de vie des projets. Méthodologie. Le projet sera exécuté avec une démarche de science du design (Design Science Research Methodology – DSRM) Bisandu (2016), les différentes phases de la DSRM permettant une maîtrise des différentes étapes et résultats intermédiaires

12h30 – 13h00

Conférencier : Mohammad Moshawrab
Titre : Securing Federated Machine Learning with Polymorphic and Homomorphic Encryption. PolyFLAG_SVM, PolyFLAM, PolyFLAP and HP_FLAP frameworks.

Abstract : Machine Learning (ML) has revolutionized various sectors by enabling the analysis of extensive datasets. Despite progress, challenges persist in the domain, with privacy and security standing out as overarching concerns. In this context, Google’s proposed Federated Learning (FL) in response to privacy issues, which distributing models to clients for local training and global aggregation, instead of collecting data on a central server. However, detailed evaluation of Federated Learning shows its vulnerability to several attacks, including inference attacks. In tackling these challenges, our research introduces four innovative Federated Learning aggregation frameworks: PolyFLAG_SVM, PolyFLAM, PolyFLAP, and HP_FLAP. Uniquely, these models incorporate both Polymorphic and Homomorphic Encryption to enhance security. Homomorphic Encryption enables secure parameter aggregation while encrypted, where Polymorphic Encryption encrypts messages with distinct keys, minimizing key compromise risks. These frameworks address various threats, including inference attacks, and implement communication cost reduction techniques for more efficiency. Validation through comprehensive evaluations, including theoretical guarantees, time and space complexity analysis, and assessments across simulated and real health-related datasets, underscores the efficacy of the proposed frameworks. Even in the rare event of compromised encryption keys, the use of unique encryption keys across clients and sessions minimize the risk. These frameworks not only offer secure and communication-efficient FL aggregation but also provide a foundational platform for future advancements, fostering the reliability and trustworthiness of the entire Federated Learning environment.

Biographie : Mohammad Moshawrab is a PhD Candidate pursuing his doctoral degree at « Université du Québec à Rimouski » since September 2020. His research focuses on Machine Learning, specifically Federated Machine Learning discipline. His studies are oriented toward enhancing Federated Learning security by embedding different approaches. During his studies, he published different peer-reviewed journal articles and shared in multiple scientific international conferences. In addition, Moshawrab has been working into Software Engineering and Development since 2011, where he held different positions at different organizations and institutions in both Lebanon and Canada.

13h00 – 13h30

Conférencier : Walid Azizi
Titre : A Contrastive Transformation-Resistant CNN-Based Approach for WebAssembly Bytecode Similarity and Malware Detection

Abstract : WebAssembly (WASM) a émergé comme un langage clé dans le monde de la programmation web. Il a rapidement gagné en popularité et est maintenant largement pris en charge par la majorité des navigateurs web modernes. Cependant, les utilisations malveillantes de WebAssembly sont variées, allant du cryptojacking à l’exécution de logiciels malveillants dans l’environnement utilisateur. Leur détection représente un défi croissant, car des modifications mineures à un binaire malveillant, en appliquant divers outils de transformation, permettent d’échapper aux mécanismes de détection existants. La détection de la similarité de code binaire est définie comme l’identification de la proximité entre deux binaires ou plus lorsque le code source n’est pas disponible. L’identification des similitudes et des différences entre les binaires WASM est essentielle pour diverses applications, allant de la rétro-ingénierie, la détection de vulnérabilités à la détection de malware et à ce jour, il existe un manque de métriques et de méthodes de similarité spécifiques à WebAssembly. De ce fait, la réalisation d’une approche de mesure de similarité pour WebAssembly qui résiste aux transformations est primordiale afin d’améliorer la détection de nouvelles applications malicieuses.

Nous présentons WASM-Shield, une approche efficace de similarité de code binaire WebAssembly basée sur une petite représentation image à trois-canaux et ResBin, une nouvelle famille de réseaux de neurones convolutifs résiduels pré-entraînés à la résistance aux transformations en se basant sur l’apprentissage contrastive à partir des ensembles de binaires que nous avons transformés via divers techniques de transformations. Notre approche consiste à générer des représentations vectorielles (embeddings) de binaires WebAssembly riches et intégrables dans les systèmes d’analyse de code binaires WebAssembly, notamment les détecteurs de malware. L’évaluation de WASM-Shield montre que les embeddings sont générés plus rapidement que les approches existantes et permettent une meilleure résistance aux transformations dans le cadre des tâches de la « détection de la similarité » et la « détection de malware » dans le contexte de binaires WebAssembly transformés. De plus, nous démontrons qu’ils permettent une meilleure préservation de la sémantique des programmes binaires dans le contexte de classes de programmes difficilement distinguables.

Biographie : Walid Azizi est un étudiant en dernière année à l’École nationale Supérieure d’Informatique (Algérie) depuis septembre 2019, où il se spécialise en Systèmes Intelligents et Données. Il participe également à un programme d’échange à l’Université du Québec à Montréal (Canada) pour réaliser son projet de fin d’études. Son travail et ses projets se concentrent principalement sur l’apprentissage automatique, avec un intérêt particulier pour la vision par ordinateur et l’optimisation. Au cours de son parcours académique, il a participé à des hackathons et a occupé différentes positions dans le domaine du génie logiciel, notamment chez une startup anglaise axée sur la manipulation des données de santé.