IEEE-Aligned 2025 – 2026 Project Journals100% Output GuaranteedReady-to-Submit Project1000+ Project Journals

IEEE-Aligned 2025 – 2026 Project JournalsLine-by-Line Code Explanation15000+ Happy Students WorldwideLatest Algorithm Architectures

Vision Transformer Projects For Final Year - IEEE Domain Overview

Vision Transformers reformulate visual understanding as a sequence modeling problem by dividing images into fixed-size patches and processing them as token embeddings. Instead of relying on local receptive fields, these models use self-attention to capture long-range dependencies, enabling holistic scene understanding and global contextual reasoning across the entire visual input.

In Vision Transformer Projects For Final Year, IEEE-aligned research emphasizes evaluation-driven attention modeling, benchmark-based experimentation, and reproducible tokenization strategies. Methodologies explored in Vision Transformer Projects For Students prioritize controlled patch design, attention head analysis, and robustness evaluation to ensure stable representation learning across varying image resolutions and dataset scales.

IEEE Vision Transformer Projects -IEEE 2026 Titles

Wisen Code:DLP-25-0212 Published on: Nov 2025

Base Paper Title:

Adaptive Incremental Learning for Robust X-Ray Threat Detection in Dynamic Operational Environments

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: None

Applications: Surveillance

Algorithms: CNN, Text Transformer, Vision Transformer

Wisen Code:IMP-25-0321 Published on: Nov 2025

Base Paper Title:

Enhancing Kidney Tumor Segmentation in MRI Using Multi-Modal Medical Images With Transformers

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0322 Published on: Nov 2025

Base Paper Title:

Explainable AI for Brain Tumor Classification Using Cross-Gated Multi-Path Attention Fusion and Gate-Consistency Loss

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Predictive Analytics, Decision Support Systems

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0320 Published on: Nov 2025

Base Paper Title:

Centralized Position Embeddings for Vision Transformers

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: Two Stage Detection, CNN, Vision Transformer, Deep Neural Networks

Wisen Code:IMP-25-0317 Published on: Oct 2025

Base Paper Title:

HATNet: Hierarchical Attention Transformer With RS-CLIP Patch Tokens for Remote Sensing Image Captioning

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Captioning

NLP Task: Text Generation

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure, Agriculture & Food Tech, Environmental & Sustainability

Applications: Remote Sensing

Algorithms: Text Transformer, Vision Transformer, Deep Neural Networks

Wisen Code:IMP-25-0299 Published on: Oct 2025

Base Paper Title:

Remote Sensing Image Object Detection Algorithm Based on DETR

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure, Agriculture & Food Tech, Environmental & Sustainability

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0044 Published on: Oct 2025

Base Paper Title:

Real-Time Detection of Mixed-Critical Events Using Vision-Language Models

Data Type: Multi Modal Data

AI/ML/DL Task: Generative Task

CV Task: Image Captioning

NLP Task: Text Classification

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure

Applications: Content Generation

Algorithms: Single Stage Detection, CNN, Vision Transformer, AlgorithmArchitectureOthers

Wisen Code:IMP-25-0248 Published on: Oct 2025

Base Paper Title:

RESRTDETR: Cross-Scale Feature Enhancement Based on Reparameterized Convolution and Channel Modulation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Energy & Utilities Tech

Applications:

Algorithms: Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0157 Published on: Oct 2025

Base Paper Title:

Transformer-Based DME Classification Using Retinal OCT Images Without Data Augmentation: An Evaluation of ViT-B16 and ViT-B32 With Optimizer Impact

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: CNN, Transfer Learning, Vision Transformer

Wisen Code:IMP-25-0311 Published on: Oct 2025

Base Paper Title:

RFTransUNet: Res-Feature Cross Vision Transformer-Based UNet for Building Extraction From High-Resolution Remote Sensing Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure, Environmental & Sustainability

Applications: Remote Sensing, Decision Support Systems

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0208 Published on: Oct 2025

Base Paper Title:

Autonomous Road Defects Segmentation Using Transformer-Based Deep Learning Models With Custom Dataset

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure

Applications: None

Algorithms: Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0032 Published on: Oct 2025

Base Paper Title:

SD-DETR: Space Debris Detection Transformer Based on Dynamic Convolutional Network and Cross-Scale Collaborative Attention

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: None

Applications: Surveillance

Algorithms: Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0034 Published on: Oct 2025

Base Paper Title:

Objective Quality Evaluation of Images Affected by Adverse Weather Conditions

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Dehazing

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0154 Published on: Oct 2025

Base Paper Title:

Boosting the Performance of Image Restoration Models Through Training With Deep-Feature Auxiliary Guidance

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Denoising

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0224 Published on: Oct 2025

Base Paper Title:

Spatial–Temporal Feature Interaction and Multiscale Frequency-Domain Fusion Network for Remote Sensing Change Detection

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Change Detection

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure, Environmental & Sustainability

Applications: Anomaly Detection

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0149 Published on: Sept 2025

Base Paper Title:

BWFNet: Bitemporal Wavelet Frequency Network for Change Detection in High-Resolution Remote Sensing Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Change Detection

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure, Environmental & Sustainability

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:GAI-25-0016 Published on: Sept 2025

Base Paper Title:

Deep Learning-Driven Craft Design: Integrating AI Into Traditional Handicraft Creation

Data Type: Image Data

AI/ML/DL Task: Generative Task

CV Task: Visual Content Synthesis

NLP Task: None

Audio Task: None

Industries: Media & Entertainment, E-commerce & Retail

Applications: Content Generation, Image Synthesis

Algorithms: GAN, CNN, Vision Transformer

Wisen Code:IMP-25-0090 Published on: Sept 2025

Base Paper Title:

STMTNet: Spatio-Temporal Multiscale Triad Network for Cropland Change Detection in Remote Sensing Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Change Detection

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Agriculture & Food Tech, Environmental & Sustainability

Applications: Predictive Analytics, Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:DLP-25-0174 Combo Offer

Published on: Sept 2025

Base Paper Title:

DualDRNet: A Unified Deep Learning Framework for Customer Baseline Load Estimation and Demand Response Potential Forecasting for Load Aggregators

Data Type: Tabular Data

AI/ML/DL Task: Time Series Task

CV Task: None

NLP Task: None

Audio Task: None

Industries: Energy & Utilities Tech

Applications: Predictive Analytics, Decision Support Systems

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:DLP-25-0101 Published on: Sept 2025

Base Paper Title:

Optimized Kolmogorov–Arnold Networks-Driven Chronic Obstructive Pulmonary Disease Detection Model

Data Type: Audio Data

AI/ML/DL Task: Classification Task

CV Task: None

NLP Task: None

Audio Task: Audio Classification

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Predictive Analytics, Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0195 Published on: Sept 2025

Base Paper Title:

Enhancing Coffee Leaf Disease Classification via Active Learning and Diverse Sample Selection

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Agriculture & Food Tech

Applications:

Algorithms: Vision Transformer, Deep Neural Networks

Wisen Code:IMP-25-0220 Published on: Sept 2025

Base Paper Title:

Multimodal SAM-Adapter for Semantic Segmentation

Data Type: Multi Modal Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Transfer Learning, Vision Transformer

Wisen Code:IMP-25-0110 Published on: Sept 2025

Base Paper Title:

Improving Medical X-Ray Imaging Diagnosis With Attention Mechanisms and Robust Transfer Learning Techniques

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0094 Published on: Sept 2025

Base Paper Title:

Prompt-Driven Multitask Learning With Task Tokens for ORSI Salient Object Detection

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: None

Applications: Remote Sensing

Algorithms: Vision Transformer

Wisen Code:CYS-25-0018 Published on: Sept 2025

Base Paper Title:

Lightweight End-to-End Patch-Based Self-Attention Network for Robust Image Forgery Detection

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Visual Anomaly Detection

NLP Task: None

Audio Task: None

Industries: Media & Entertainment, LegalTech & Law, Government & Public Services

Applications: None

Algorithms: Vision Transformer

Wisen Code:IMP-25-0026 Published on: Sept 2025

Base Paper Title:

GF-ResFormer: A Hybrid Gabor-Fourier ResNet-Transformer Network for Precise Semantic Segmentation of High-Resolution Remote Sensing Imagery

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0264 Published on: Sept 2025

Base Paper Title:

Detection to Framework for Traffic Signs Using a Hybrid Approach

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure

Applications: None

Algorithms: Two Stage Detection, Single Stage Detection, Vision Transformer

Wisen Code:DLP-25-0141 Published on: Sept 2025

Base Paper Title:

A Novel Transformer-CNN Hybrid Deep Learning Architecture for Robust Broad-Coverage Diagnosis of Eye Diseases on Color Fundus Images

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0120 Published on: Sept 2025

Base Paper Title:

TANet: A Multi-Representational Attention Approach for Change Detection in Very High-Resolution Remote Sensing Imagery

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Change Detection

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure, Agriculture & Food Tech, Environmental & Sustainability

Applications: Remote Sensing

Algorithms: GAN, CNN, Vision Transformer, Residual Network, Deep Neural Networks

Wisen Code:IMP-25-0266 Published on: Sept 2025

Base Paper Title:

Adaptive Fusion of LiDAR and Camera Data for Enhanced Precision in 3D Object Detection for Autonomous Driving

Data Type: Multi Modal Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: None

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:GAI-25-0024 Published on: Sept 2025

Base Paper Title:

Prompt Driven Multimodal Large Language Models for Concrete Defect Identification

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure

Applications: Anomaly Detection

Algorithms: Single Stage Detection, CNN, Vision Transformer, Deep Neural Networks

Wisen Code:IMP-25-0241 Published on: Aug 2025

Base Paper Title:

Enhancing Worker Safety at Heights: A Deep Learning Model for Detecting Helmets and Harnesses Using DETR Architecture

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries:

Applications: Surveillance, Anomaly Detection

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0018 Published on: Aug 2025

Base Paper Title:

An Improved Method for Zero-Shot Semantic Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Automotive

Applications: Remote Sensing

Algorithms: Transfer Learning, Vision Transformer

Wisen Code:IMP-25-0122 Published on: Aug 2025

Base Paper Title:

Design of a CNN–Swin Transformer Model for Alzheimer’s Disease Prediction Using MRI Images

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI

Applications: Predictive Analytics, Decision Support Systems

Algorithms: GAN, CNN, Vision Transformer

Wisen Code:IMP-25-0093 Published on: Aug 2025

Base Paper Title:

JDAWSL: Joint Domain Adaptation With Weight Self-Learning for Hyperspectral Few-Shot Classification

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Agriculture & Food Tech, Environmental & Sustainability

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:DLP-25-0107 Published on: Aug 2025

Base Paper Title:

HyperEAST: An Enhanced Attention-Based Spectral–Spatial Transformer With Self-Supervised Pretraining for Hyperspectral Image Classification

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Agriculture & Food Tech, Environmental & Sustainability

Applications: Remote Sensing

Algorithms: Vision Transformer

Wisen Code:IMP-25-0155 Published on: Aug 2025

Base Paper Title:

Two-Stage Neural Network Pipeline for Kidney and Tumor Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: None

Algorithms: Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0193 Published on: Aug 2025

Base Paper Title:

Weighted Feature Fusion Network Based on Large Kernel Convolution and Transformer for Multi-Modal Remote Sensing Image Segmentation

Data Type: Multi Modal Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: None

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer

Wisen Code:BIG-25-0002 Published on: Aug 2025

Base Paper Title:

ULDepth: Transform Self-Supervised Depth Estimation to Unpaired Multi-Domain Learning

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Depth Estimation

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: GAN, CNN, Vision Transformer

Wisen Code:IMP-25-0236 Published on: Aug 2025

Base Paper Title:

ATT-CR: Adaptive Triangular Transformer for Cloud Removal

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Reconstruction

NLP Task: None

Audio Task: None

Industries: None

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0009 Published on: Aug 2025

Base Paper Title:

Improving Token-Based Object Detection With Video

Data Type: Video Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Text Transformer, Vision Transformer

Wisen Code:DLP-25-0090 Published on: Aug 2025

Base Paper Title:

LARNet-SAP-YOLOv11: A Joint Model for Image Restoration and Corrosion Defect Detection of Transmission Line Fittings Under Multiple Adverse Weather Conditions

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Energy & Utilities Tech

Applications: None

Algorithms: Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0310 Published on: Aug 2025

Base Paper Title:

SAFH-Net: A Hybrid Network With Shuffle Attention and Adaptive Feature Fusion for Enhanced Retinal Vessel Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems, Anomaly Detection

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0011 Published on: Aug 2025

Base Paper Title:

Squeeze-SwinFormer: Spectral Squeeze and Excitation Swin Transformer Network for Hyperspectral Image Classification

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0088 Published on: Aug 2025

Base Paper Title:

Self Attention GAN and SWIN Transformer-Based Pothole Detection With Trust Region-Based LSM and Hough Line Transform for 2D to 3D Conversion

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure, Automotive

Applications: Surveillance, Anomaly Detection

Algorithms: Single Stage Detection, GAN, Vision Transformer, Convex Optimization

Wisen Code:DLP-25-0054 Published on: Jul 2025

Base Paper Title:

ASFF-Det: Adaptive Space-Frequency Fusion Detector for Object Detection in SAR Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Environmental & Sustainability

Applications: Remote Sensing, Surveillance

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0036 Published on: Jul 2025

Base Paper Title:

SN360: Semantic and Surface Normal Cascaded Multi-Task 360 Monocular Depth Estimation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Depth Estimation

NLP Task: None

Audio Task: None

Industries: Media & Entertainment, Manufacturing & Industry 4.0, Smart Cities & Infrastructure, Logistics & Supply Chain

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0225 Published on: Jul 2025

Base Paper Title:

Frequency Spectrum Adaptor for Remote Sensing Image–Text Retrieval

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Retrieval

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Agriculture & Food Tech

Applications: Remote Sensing, Information Retrieval

Algorithms: Transfer Learning, Vision Transformer, Statistical Algorithms

Wisen Code:IMP-25-0271 Published on: Jul 2025

Base Paper Title:

Attention-Based Dual-Knowledge Distillation for Alzheimer’s Disease Stage Detection Using MRI Scans

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: Vision Transformer

Wisen Code:BIG-25-0023 Published on: Jul 2025

Base Paper Title:

Power Transmission Corridors Wildfire Detection for Multi-Scale Fusion and Adaptive Texture Learning Based on Transformers

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Energy & Utilities Tech

Applications: Remote Sensing, Surveillance

Algorithms: Two Stage Detection, Single Stage Detection, CNN, Vision Transformer, Residual Network

Wisen Code:DLP-25-0118 Published on: Jul 2025

Base Paper Title:

Soybean Yield Estimation Using Improved Deep Learning Models With Integrated Multisource and Multitemporal Remote Sensing Data

Data Type: Multi Modal Data

AI/ML/DL Task: Regression Task

CV Task: None

NLP Task: None

Audio Task: None

Industries: Finance & FinTech, Government & Public Services, Agriculture & Food Tech

Applications: Remote Sensing, Predictive Analytics, Decision Support Systems

Algorithms: Classical ML Algorithms, RNN/LSTM, CNN, Vision Transformer

Wisen Code:IMP-25-0166 Published on: Jul 2025

Base Paper Title:

SPOT: An Active Learning Algorithm for Efficient Deep Neural Network Training

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0170 Published on: Jul 2025

Base Paper Title:

A Temporal–Spatial–Spectral Fusion Framework for Coastal Wetland Mapping on Time-Series Remote Sensing Imagery

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Environmental & Sustainability

Applications:

Algorithms: RNN/LSTM, CNN, Vision Transformer

Wisen Code:IMP-25-0175 Published on: Jul 2025

Base Paper Title:

DB-Net: A Dual-Branch Hybrid Network for Stroke Lesion Segmentation on Non-Contrast CT Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0168 Published on: Jul 2025

Base Paper Title:

RFHS-RTDETR: Multi-Domain Collaborative Network With Hierarchical Feature Integration for UAV-Based Object Detection

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: None

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0164 Published on: Jul 2025

Base Paper Title:

SuperCoT-X: Masked Hyperspectral Image Modeling With Diverse Superpixel-Level Contrastive Tokenizer

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Agriculture & Food Tech, Environmental & Sustainability

Applications: None

Algorithms: Vision Transformer

Wisen Code:DLP-25-0147 Published on: Jul 2025

Base Paper Title:

An Improved Backbone Fusion Neural Network for Orchard Extraction

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Agriculture & Food Tech, Environmental & Sustainability

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0134 Published on: Jul 2025

Base Paper Title:

DAM-Net: Domain Adaptation Network With Microlabeled Fine-Tuning for Change Detection

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Change Detection

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure, Environmental & Sustainability

Applications: Remote Sensing

Algorithms: GAN, CNN, Vision Transformer

Wisen Code:IMP-25-0314 Published on: Jul 2025

Base Paper Title:

Transformer-Guided Serial Knowledge Distillation for High-Precision Anomaly Detection

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Visual Anomaly Detection

NLP Task: None

Audio Task: None

Industries: Manufacturing & Industry 4.0, Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Anomaly Detection

Algorithms: CNN, Transfer Learning, Autoencoders, Vision Transformer

Wisen Code:IMP-25-0019 Published on: Jun 2025

Base Paper Title:

HyCoViT: Hybrid Convolution Vision Transformer With Dynamic Dropout for Enhanced Medical Chest X-Ray Classification

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0129 Published on: Jun 2025

Base Paper Title:

DFC-Net: Dual-Branch Collaborative Feature Enhancement for Cloud Detection in Remote Sensing Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: None

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0301 Published on: Jun 2025

Base Paper Title:

Weighted Ensemble Based on Prisoner Dilemma for Facial Expression Recognition

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: None

Applications:

Algorithms: CNN, Vision Transformer, Ensemble Learning

Wisen Code:IMP-25-0160 Published on: Jun 2025

Base Paper Title:

Hyperspectral Pansharpening Enhanced With Multi-Image Super-Resolution for PRISMA Data

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Super-Resolution

NLP Task: None

Audio Task: None

Industries: None

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer, Deep Neural Networks, Graph Neural Networks

Wisen Code:IMP-25-0074 Published on: Jun 2025

Base Paper Title:

TMAR: 3-D Transformer Network via Masked Autoencoder Regularization for Hyperspectral Sharpening

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Super-Resolution

NLP Task: None

Audio Task: None

Industries: None

Applications: Remote Sensing

Algorithms: CNN, Autoencoders, Vision Transformer, Residual Network

Wisen Code:GAI-25-0010 Published on: Jun 2025

Base Paper Title:

When Multimodal Large Language Models Meet Computer Vision: Progressive GPT Fine-Tuning and Stress Testing

Data Type: Multi Modal Data

AI/ML/DL Task: Generative Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: E-commerce & Retail

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0017 Published on: Jun 2025

Base Paper Title:

Transfer Learning Between Sentinel-1 Acquisition Modes Enhances the Few-Shot Segmentation of Natural Oil Slicks in the Arctic

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Environmental & Sustainability

Applications: Remote Sensing

Algorithms: CNN, Transfer Learning, Vision Transformer, Residual Network, Deep Neural Networks

Wisen Code:IMP-25-0204 Published on: Jun 2025

Base Paper Title:

Attention-Enhanced CNN for High-Performance Deepfake Detection: A Multi-Dataset Study

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Media & Entertainment, Social Media & Communication Platforms, Government & Public Services

Applications: Anomaly Detection

Algorithms: CNN, Autoencoders, Vision Transformer

Wisen Code:IMP-25-0268 Published on: Jun 2025

Base Paper Title:

FUSCANet: Enhancing Skin Disease Classification Through Feature Fusion and Spatial-Channel Attention Mechanisms

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0260 Published on: Jun 2025

Base Paper Title:

PlantHealthNet: Transformer-Enhanced Hybrid Models for Disease Diagnosis and Severity Estimation in Agriculture

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Agriculture & Food Tech

Applications: Predictive Analytics, Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0028 Published on: May 2025

Base Paper Title:

Global Structural Knowledge Distillation for Semantic Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:DLP-25-0027 Published on: May 2025

Base Paper Title:

A Multi-Modal Approach for the Molecular Subtype Classification of Breast Cancer by Using Vision Transformer and Novel SVM Polyvariant Kernel

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: Classical ML Algorithms, CNN, Vision Transformer

Wisen Code:IMP-25-0046 Published on: May 2025

Base Paper Title:

MMTraP: Multi-Sensor Multi-Agent Trajectory Prediction in BEV

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Manufacturing & Industry 4.0, Smart Cities & Infrastructure

Applications: Predictive Analytics

Algorithms: CNN, Vision Transformer

Wisen Code:DLP-25-0004 Published on: May 2025

Base Paper Title:

Hybrid Deep Learning and Fuzzy Matching for Real-Time Bidirectional Arabic Sign Language Translation: Toward Inclusive Communication Technologies

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: Single Stage Detection, CNN, Transfer Learning, Vision Transformer

Wisen Code:IMP-25-0226 Published on: May 2025

Base Paper Title:

Density-Aware DETR With Dynamic Query for End-to-End Tiny Object Detection

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: None

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0213 Published on: May 2025

Base Paper Title:

Self- and Cross-Attention Enhanced Transformer for Visible and Thermal Infrared Hyperspectral Image Classification

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Agriculture & Food Tech, Environmental & Sustainability

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0075 Published on: May 2025

Base Paper Title:

ITT: Long-Range Spatial Dependencies for Sea Ice Semantic Segmentation

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Environmental & Sustainability

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0290 Published on: May 2025

Base Paper Title:

A Novel Hybrid Architecture With Fast Lightweight Encoder and Transformer Under Attention Fusion for the Enhancement of Sand Dust and Haze Image Restoration

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Dehazing

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:DLP-25-0126 Published on: May 2025

Base Paper Title:

Segmentation and Classification of Skin Cancer Diseases Based on Deep Learning: Challenges and Future Directions

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: None

Algorithms: Two Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0259 Published on: May 2025

Base Paper Title:

Osteosarcoma CT Image Segmentation Based on OSCA-TransUnet Model

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0113 Published on: May 2025

Base Paper Title:

M$^{2}$Convformer: Multiscale Masked Hybrid Convolution-Transformer Network for Hyperspectral Image Super-Resolution

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Super-Resolution

NLP Task: None

Audio Task: None

Industries: None

Applications: Remote Sensing

Algorithms: CNN, Autoencoders, Vision Transformer

Wisen Code:IMP-25-0156 Published on: May 2025

Base Paper Title:

TuSegNet: A Transformer-Based and Attention-Enhanced Architecture for Brain Tumor Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0014 Published on: May 2025

Base Paper Title:

Hybrid Dual-Input Model for Respiratory Sound Classification With Mel Spectrogram and Waveform

Data Type: Audio Data

AI/ML/DL Task: Classification Task

CV Task: None

NLP Task: None

Audio Task: Audio Classification

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:GAI-25-0030 Published on: Apr 2025

Base Paper Title:

Multi-Scale Attentional Style Transfer Model With Imbalanced Contrastive Loss

Data Type: Image Data

AI/ML/DL Task: Generative Task

CV Task: Style Transfer

NLP Task: None

Audio Task: None

Industries: Media & Entertainment

Applications: Content Generation, Image Synthesis

Algorithms: GAN, CNN, Vision Transformer

Wisen Code:IMP-25-0237 Published on: Apr 2025

Base Paper Title:

Swin Transformer and Momentum Contrast (MoCo) in Leukemia Diagnostics: A New Paradigm in AI-Driven Blood Cell Cancer Classification

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: Vision Transformer

Wisen Code:IMP-25-0309 Published on: Apr 2025

Base Paper Title:

CTCNet: A CNN-Transformer Dual Branch Network for Sand Dune Image Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Environmental & Sustainability

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0215 Published on: Apr 2025

Base Paper Title:

Intraoperative Surgical Navigation and Instrument Localization Using a Supervised Learning Transformer Network

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:DLP-25-0057 Published on: Apr 2025

Base Paper Title:

Manhattan Correlation Attention Network for Metal Part Anomaly Classification

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Visual Anomaly Detection

NLP Task: None

Audio Task: None

Industries: Manufacturing & Industry 4.0

Applications: Anomaly Detection

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0069 Published on: Apr 2025

Base Paper Title:

Content-Based Image Retrieval for Multi-Class Volumetric Radiology Images: A Benchmark Study

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Retrieval

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Information Retrieval

Algorithms: Transfer Learning, Vision Transformer, Residual Network

Wisen Code:IMP-25-0067 Published on: Apr 2025

Base Paper Title:

A Super-Resolution Approach for Image Resizing of Infant Fingerprints With Vision Transformers

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Super-Resolution

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: Vision Transformer

Wisen Code:IMP-25-0304 Published on: Apr 2025

Base Paper Title:

A Blur-Score-Guided Region Selection Method for Airborne Aircraft Detection in Remote Sensing Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure

Applications: Remote Sensing

Algorithms: Two Stage Detection, Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0005 Published on: Apr 2025

Base Paper Title:

A Transfer Learning Approach for Landslide Semantic Segmentation Based on Visual Foundation Model

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: None

Applications:

Algorithms: CNN, Transfer Learning, Vision Transformer

Wisen Code:IMP-25-0296 Published on: Apr 2025

Base Paper Title:

Open-Vocabulary High-Resolution Remote Sensing Image Semantic Segmentation

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure, Agriculture & Food Tech, Environmental & Sustainability

Applications:

Algorithms: Vision Transformer

Wisen Code:DLP-25-0166 Published on: Apr 2025

Base Paper Title:

Vision Transformers Versus Convolutional Neural Networks: Comparing Robustness by Exploiting Varying Local Features

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: Classical ML Algorithms, CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0192 Published on: Apr 2025

Base Paper Title:

Satellite Image Inpainting With Edge-Conditional Expectation Attention

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Inpainting

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: Vision Transformer

Wisen Code:IMP-25-0150 Published on: Apr 2025

Base Paper Title:

CD-STMamba: Toward Remote Sensing Image Change Detection With Spatio-Temporal Interaction Mamba Model

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Change Detection

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:AND-25-0004 Published on: Apr 2025

Base Paper Title:

Enhancing Object Detection in Assistive Technology for the Visually Impaired: A DETR-Based Approach

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI

Applications: Robotics

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0187 Published on: Apr 2025

Base Paper Title:

Deep Learning Approaches for Morphological Classification of Intestinal Organoids

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications:

Algorithms: Classical ML Algorithms, CNN, Vision Transformer

Wisen Code:IMP-25-0185 Published on: Mar 2025

Base Paper Title:

Deep Fusion of Neurophysiological and Facial Features for Enhanced Emotion Detection

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: None

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI

Applications:

Algorithms: RNN/LSTM, Text Transformer, Vision Transformer, Deep Neural Networks

Wisen Code:BIG-25-0015 Published on: Mar 2025

Base Paper Title:

Toward an Integrated Intelligent Framework for Crowd Control and Management (IICCM)

Data Type: Image Data

AI/ML/DL Task: None

CV Task: None

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure

Applications: Predictive Analytics, Decision Support Systems, Anomaly Detection

Algorithms: Classical ML Algorithms, RNN/LSTM, GAN, CNN, Vision Transformer

Wisen Code:IMP-25-0010 Published on: Mar 2025

Base Paper Title:

ESFormer: A Pillar-Based Object Detection Method Based on Point Cloud Expansion Sampling and Optimised Swin Transformer

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Manufacturing & Industry 4.0, Smart Cities & Infrastructure, Logistics & Supply Chain

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:DLP-25-0068 Published on: Mar 2025

Base Paper Title:

Finger Vein Recognition Based on Vision Transformer With Feature Decoupling for Online Payment Applications

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Finance & FinTech, Banking & Insurance

Applications: None

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0179 Published on: Mar 2025

Base Paper Title:

Cross-Modality Object Detection Based on DETR

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure, Automotive

Applications: Remote Sensing, Surveillance

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0144 Published on: Mar 2025

Base Paper Title:

Transforming Highway Safety With Autonomous Drones and AI: A Framework for Incident Detection and Emergency Response

Data Type: Video Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: Text Generation

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure

Applications: Decision Support Systems, Anomaly Detection

Algorithms: Single Stage Detection, Text Transformer, Vision Transformer

Wisen Code:DLP-25-0137 Published on: Mar 2025

Base Paper Title:

Vision Transformer-Based Anomaly Detection in Smart Grid Phasor Measurement Units Using Deep Learning Models

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Visual Anomaly Detection

NLP Task: None

Audio Task: None

Industries: Energy & Utilities Tech

Applications: Anomaly Detection

Algorithms: CNN, Transfer Learning, Vision Transformer

Wisen Code:DLP-25-0120 Published on: Mar 2025

Base Paper Title:

FLaNS: Feature-Label Negative Sampling for Out-of-Distribution Detection

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Anomaly Detection

Algorithms: Classical ML Algorithms, Vision Transformer

Wisen Code:DLP-25-0016 Published on: Mar 2025

Base Paper Title:

A Hybrid Deep Learning Approach for Skin Lesion Segmentation With Dual Encoders and Channel-Wise Attention

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0053 Published on: Mar 2025

Base Paper Title:

Cross-Scale Transformer-Based Matching Network for Generalizable Person Re-Identification

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: None

Applications: Surveillance

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0313 Published on: Mar 2025

Base Paper Title:

Vision Foundation Model Guided Multimodal Fusion Network for Remote Sensing Semantic Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Environmental & Sustainability

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0295 Published on: Feb 2025

Base Paper Title:

Integrate the Temporal Scheme for Unsupervised Video Summarization via Attention Mechanism

Data Type: Video Data

AI/ML/DL Task: None

CV Task: None

NLP Task: Summarization

Audio Task: None

Industries: Media & Entertainment, Social Media & Communication Platforms, Healthcare & Clinical AI, Government & Public Services, Education & EdTech

Applications: Information Retrieval

Algorithms: RNN/LSTM, GAN, Variational Autoencoders, Vision Transformer

Wisen Code:IMP-25-0228 Published on: Feb 2025

Base Paper Title:

FRORS: An Effective Fine-Grained Retrieval Framework for Optical Remote Sensing Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Retrieval

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Environmental & Sustainability

Applications: Information Retrieval

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0161 Published on: Feb 2025

Base Paper Title:

Design of Enhanced License Plate Information Recognition Algorithm Based on Environment Perception

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Optical Character Recognition (OCR)

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure, Automotive

Applications: Surveillance

Algorithms: Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0247 Published on: Feb 2025

Base Paper Title:

A Spatial and Semantic Alignment Fusion Network for SeaLand Port Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Logistics & Supply Chain, Environmental & Sustainability

Applications: Remote Sensing, Surveillance

Algorithms: CNN, Vision Transformer, Residual Network

Wisen Code:IMP-25-0231 Published on: Feb 2025

Base Paper Title:

High Precision Infant Facial Expression Recognition by Improved YOLOv8

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI

Applications: Decision Support Systems

Algorithms: Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0024 Published on: Feb 2025

Base Paper Title:

Explainable Mapping of the Irregular Land Use Parcel With a Data Fusion Deep-Learning Model

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure

Applications:

Algorithms: Classical ML Algorithms, Vision Transformer

Wisen Code:IMP-25-0092 Published on: Feb 2025

Base Paper Title:

ELTrack: Events-Language Description for Visual Object Tracking

Data Type: Multi Modal Data

AI/ML/DL Task: None

CV Task: Object Detection

NLP Task: Feature Extraction

Audio Task: None

Industries: Manufacturing & Industry 4.0, Smart Cities & Infrastructure

Applications: None

Algorithms: CNN, Text Transformer, Vision Transformer

Wisen Code:IMP-25-0125 Published on: Feb 2025

Base Paper Title:

Attention Enhanced InceptionNeXt-Based Hybrid Deep Learning Model for Lung Cancer Detection

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI

Applications: Decision Support Systems

Algorithms: CNN, Vision Transformer

Wisen Code:IMP-25-0181 Published on: Feb 2025

Base Paper Title:

An Inverted Residual Cross Head Knowledge Distillation Network for Remote Sensing Scene Image Classification

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure, Agriculture & Food Tech, Environmental & Sustainability

Applications:

Algorithms: CNN, Vision Transformer

Wisen Code:DLP-25-0161 Published on: Jan 2025

Base Paper Title:

Robustifying Routers Against Input Perturbations for Sparse Mixture-of-Experts Vision Transformers

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Image Classification

NLP Task: None

Audio Task: None

Industries: None

Applications: None

Algorithms: Vision Transformer

Wisen Code:IMP-25-0256 Published on: Jan 2025

Base Paper Title:

EMSNet: Efficient Multimodal Symmetric Network for Semantic Segmentation of Urban Scene From Remote Sensing Imagery

Data Type: Multi Modal Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Government & Public Services, Smart Cities & Infrastructure, Environmental & Sustainability

Applications: None

Algorithms: CNN, Transfer Learning, Vision Transformer

Wisen Code:IMP-25-0171 Published on: Jan 2025

Base Paper Title:

Tongue-LiteSAM: A Lightweight Model for Tongue Image Segmentation With Zero-Shot

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Healthcare & Clinical AI, Biomedical & Bioinformatics

Applications: None

Algorithms: Vision Transformer

Wisen Code:IMP-25-0278 Published on: Jan 2025

Base Paper Title:

Transformer-Based Person Detection in Paired RGB-T Aerial Images With VTSaR Dataset

Data Type: Image Data

AI/ML/DL Task: Classification Task

CV Task: Object Detection

NLP Task: None

Audio Task: None

Industries:

Applications: Surveillance

Algorithms: Vision Transformer

Wisen Code:IMP-25-0211 Published on: Jan 2025

Base Paper Title:

Dual-Granularity Feature Alignment for Change Detection in Remote Sensing Images

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Change Detection

NLP Task: None

Audio Task: None

Industries: Smart Cities & Infrastructure, Agriculture & Food Tech, Environmental & Sustainability

Applications: Remote Sensing

Algorithms: CNN, Vision Transformer, Deep Neural Networks

Wisen Code:IMP-25-0057 Published on: Jan 2025

Base Paper Title:

Transformer-Based Multi-Player Tracking and Skill Recognition Framework for Volleyball Analytics

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Video Action Recognition

NLP Task: None

Audio Task: None

Industries: Media & Entertainment

Applications: None

Algorithms: Single Stage Detection, CNN, Vision Transformer

Wisen Code:IMP-25-0015 Published on: Jan 2025

Base Paper Title:

Multiscale Adapter Based on SAM for Remote Sensing Semantic Segmentation

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Environmental & Sustainability

Applications: Remote Sensing

Algorithms: Vision Transformer

Wisen Code:IMP-25-0172 Published on: Jan 2025

Base Paper Title:

Unsupervised Visual-to-Geometric Feature Reconstruction for Vision-Based Industrial Anomaly Detection

Data Type: Image Data

AI/ML/DL Task: None

CV Task: Image Segmentation

NLP Task: None

Audio Task: None

Industries: Manufacturing & Industry 4.0

Applications: Anomaly Detection

Algorithms: Autoencoders, Vision Transformer, Graph Neural Networks

Vision Transformer Projects For Students - Key Algorithm Variants

Vision Transformer (ViT):

The original Vision Transformer processes images as sequences of patch embeddings passed through stacked transformer encoders. It emphasizes global attention without convolutional inductive bias.

In Vision Transformer Projects For Final Year, ViT models are evaluated using benchmark datasets and attention visualization metrics. IEEE Vision Transformer Projects and Final Year Vision Transformer Projects emphasize reproducible comparison.

Data-efficient Image Transformer (DeiT):

DeiT improves ViT training efficiency by introducing knowledge distillation and optimized training strategies. It emphasizes data-efficient learning.

In Vision Transformer Projects For Final Year, DeiT variants are validated through controlled experiments. Vision Transformer Projects For Students emphasize convergence stability.

Swin Transformer:

Swin Transformer introduces hierarchical representations using shifted window attention, enabling scalability to high-resolution images. It balances global modeling and computational efficiency.

In Vision Transformer Projects For Final Year, Swin models are evaluated using reproducible protocols. IEEE Vision Transformer Projects emphasize performance scalability analysis.

Hybrid Vision Transformer:

Hybrid ViT architectures integrate convolutional feature extractors with transformer encoders. They emphasize improved local feature encoding.

In Vision Transformer Projects For Final Year, hybrid models are benchmarked against pure transformer baselines. Final Year Vision Transformer Projects emphasize representation comparison.

Hierarchical Vision Transformers:

Hierarchical transformers model visual features across multiple spatial scales. These architectures emphasize progressive abstraction.

In Vision Transformer Projects For Final Year, hierarchical variants are validated using multi-scale evaluation metrics. IEEE Vision Transformer Projects emphasize robustness analysis.

Final Year Vision Transformer Projects - Wisen TMER-V Methodology

T — Task What primary task (& extensions, if any) does the IEEE journal address?

Vision transformer tasks focus on global visual representation learning through self-attention.
IEEE literature studies patch-based tokenization and attention dynamics.

Patch tokenization
Sequence modeling
Attention computation
Performance evaluation

M — Method What IEEE base paper algorithm(s) or architectures are used to solve the task?

Dominant methods rely on transformer encoders operating on visual tokens.
IEEE research emphasizes reproducible attention modeling.

Patch embedding
Multi-head self-attention
Position encoding
Transformer blocks

E — Enhancement What enhancements are proposed to improve upon the base paper algorithm?

Enhancements focus on improving efficiency and scalability.
IEEE studies integrate hierarchical and window-based attention.

Window attention
Hierarchical modeling
Efficient token processing
Attention optimization

R — Results Why do the enhancements perform better than the base paper algorithm?

Results demonstrate improved global context modeling.
IEEE evaluations emphasize statistically significant gains.

Higher accuracy
Stable convergence
Improved generalization
Attention consistency

V — Validation How are the enhancements scientifically validated?

Validation relies on benchmark datasets and controlled protocols.
IEEE methodologies stress reproducibility and comparative analysis.

Benchmark evaluation
Attention visualization
Ablation studies
Statistical testing

IEEE Vision Transformer Projects - Libraries & Frameworks

PyTorch:

PyTorch is widely used to implement vision transformer architectures due to its flexibility in defining attention layers and transformer blocks. It supports rapid experimentation.

Vision Transformer Projects For Final Year rely on PyTorch for reproducible experimentation. IEEE Vision Transformer Projects emphasize evaluation consistency.

TensorFlow:

TensorFlow provides scalable pipelines for training large vision transformer models. It supports distributed execution.

Vision Transformer Projects For Final Year emphasize reproducibility. Vision Transformer Projects For Students rely on controlled validation.

Hugging Face Transformers:

This library provides prebuilt vision transformer architectures and training utilities. It supports rapid benchmarking.

Final Year Vision Transformer Projects rely on it for baseline comparison. IEEE Vision Transformer Projects emphasize consistency.

NumPy:

NumPy supports numerical operations for token processing and evaluation. It aids reproducible experimentation.

Vision Transformer Projects For Students rely on NumPy for analysis.

Matplotlib:

Matplotlib visualizes attention maps and training behavior. Visualization aids interpretability.

IEEE Vision Transformer Projects rely on Matplotlib for evaluation reporting.

Vision Transformer Projects For Students - Real World Applications

Image Classification:

Vision transformers classify images by learning global contextual representations. Self-attention improves long-range dependency modeling.

Vision Transformer Projects For Final Year evaluate performance using benchmark datasets. IEEE Vision Transformer Projects emphasize metric-driven validation.

Object Recognition:

Transformers model object relationships across entire scenes. Global attention improves recognition accuracy.

Final Year Vision Transformer Projects emphasize reproducible evaluation. Vision Transformer Projects For Students rely on controlled benchmarking.

Medical Image Analysis:

Vision transformers analyze medical imagery by capturing holistic structural patterns. Global context aids diagnosis.

Vision Transformer Projects For Final Year emphasize quantitative validation. IEEE Vision Transformer Projects rely on standardized evaluation.

Video Frame Understanding:

Transformers process visual frames to extract global representations. Attention improves consistency.

Final Year Vision Transformer Projects emphasize benchmark-driven analysis. Vision Transformer Projects For Students rely on reproducible experimentation.

Remote Sensing Analysis:

Vision transformers interpret satellite imagery by modeling large-scale spatial relationships. Global attention enhances accuracy.

Vision Transformer Projects For Final Year validate performance through benchmark comparison. IEEE Vision Transformer Projects emphasize consistency.

Final Year Vision Transformer Projects - Conceptual Foundations

Vision transformers are conceptually based on representing images as sequences of visual tokens, enabling the application of transformer architectures originally designed for language modeling. By dividing an image into patches and embedding them as tokens, the model learns relationships between distant regions using self-attention, allowing global context modeling without relying on spatial locality assumptions inherent to convolution-based designs.

From a research-oriented perspective, Vision Transformer Projects For Final Year treat visual understanding as a sequence learning problem governed by attention distribution, token interaction, and positional encoding. Conceptual rigor is achieved through analysis of attention head behavior, token resolution tradeoffs, and representation stability across layers, following IEEE vision transformer research methodologies.

Within the broader computer vision ecosystem, vision transformers intersect with image processing projects and video processing projects. They also connect to generative AI projects, where transformer-based attention mechanisms enable scalable visual generation and reasoning.

IEEE Vision Transformer Projects - Why Choose Wisen

Wisen supports vision transformer research through IEEE-aligned methodologies, evaluation-focused design, and structured algorithm-level implementation practices.

✓

Attention-Centric Evaluation Alignment

Projects are structured around attention behavior analysis, token interaction evaluation, and metric-driven benchmarking to meet IEEE vision transformer research standards.

✓

Research-Grade Transformer Design

Vision Transformer Projects For Final Year emphasize systematic experimentation with patch size, attention heads, and encoder depth.

✓

End-to-End Transformer Workflow

The Wisen implementation pipeline supports vision transformer research from tokenization strategy design through controlled experimentation and result interpretation.

✓

Scalability and Publication Readiness

Projects are designed to support extension into IEEE research papers through architectural refinement, efficiency analysis, and evaluation expansion.

✓

Cross-Domain Vision Intelligence

Wisen positions vision transformers within a broader visual intelligence ecosystem, enabling alignment with classification, detection, and multimodal reasoning domains.

Vision Transformer Projects For Students - IEEE Research Areas

Self-Attention Optimization:

This research area focuses on improving attention efficiency and stability in vision transformers. IEEE studies emphasize scalable attention mechanisms.

Evaluation relies on attention consistency and performance metrics.

Patch Tokenization Strategies:

Research investigates how patch size and embedding influence representation quality. IEEE Vision Transformer Projects emphasize token resolution analysis.

Validation includes benchmark comparison across configurations.

Hierarchical Attention Modeling:

This area studies multi-scale attention designs for visual abstraction. Vision Transformer Projects For Students frequently explore hierarchical encoders.

Evaluation focuses on robustness and generalization.

Efficiency and Computational Scaling:

Research explores reducing computational cost while preserving accuracy. Final Year Vision Transformer Projects emphasize efficiency-aware design.

Evaluation relies on accuracy-to-computation tradeoff analysis.

Evaluation Metric Design for Transformers:

Metric research focuses on defining transformer-specific evaluation measures. IEEE studies emphasize attention interpretability.

Evaluation includes statistical testing and benchmark-based comparison.

Final Year Vision Transformer Projects - Career Outcomes

Vision Transformer Research Engineer:

Research engineers design and analyze transformer-based vision architectures with emphasis on attention modeling and representation quality. Vision Transformer Projects For Final Year align directly with IEEE research roles.

Expertise includes architectural experimentation, benchmarking, and reproducible evaluation.

Computer Vision Research Scientist:

Vision researchers explore global-context modeling using transformers. IEEE Vision Transformer Projects provide strong role alignment.

Skills include hypothesis-driven experimentation and publication-ready analysis.

AI Engineer – Transformer Models:

Engineers apply transformer architectures to large-scale visual data. Final Year Vision Transformer Projects emphasize scalability and robustness.

Skill alignment includes performance benchmarking and deployment-aware validation.

Applied Machine Learning Engineer:

Applied engineers integrate vision transformers into analytical pipelines. Vision Transformer Projects For Students support role preparation.

Expertise includes evaluation analysis and model optimization.

Model Validation and Performance Analyst:

Validation analysts assess attention stability and generalization. IEEE-aligned roles prioritize metric-driven evaluation.

Expertise includes attention analysis, robustness testing, and statistical performance assessment.

Vision Transformer Projects For Final Year - FAQ

What are some good project ideas in IEEE Vision Transformer Domain Projects for a final-year student?

Good project ideas focus on patch-based visual tokenization, transformer encoder design, attention mechanism analysis, and benchmark-based evaluation aligned with IEEE vision transformer research.

What are trending Vision Transformer final year projects?

Trending projects emphasize vision transformers, hybrid transformer architectures, attention optimization, and evaluation-driven experimentation.

What are top Vision Transformer projects in 2026?

Top projects in 2026 focus on scalable vision transformer pipelines, reproducible experimentation, and IEEE-aligned evaluation methodologies.

Is the Vision Transformer domain suitable or best for final-year projects?

The domain is suitable due to strong IEEE research relevance, global context modeling capability, and well-defined evaluation protocols.

Which evaluation metrics are commonly used in vision transformer research?

IEEE-aligned vision transformer research evaluates performance using accuracy, F1-score, attention stability analysis, and convergence behavior metrics.

How do vision transformers differ from convolutional neural networks?

Vision transformers model global relationships using self-attention, whereas CNNs rely on local convolution operations and spatial inductive bias.

What role does patch embedding play in vision transformers?

Patch embedding converts image regions into token representations that enable transformer-based sequence modeling of visual data.

Can vision transformer projects be extended into IEEE research papers?

Yes, vision transformer projects are frequently extended into IEEE research papers through architectural enhancements, attention optimization, and evaluation refinement.

Final Year Projects ONLY from from IEEE 2025-2026 Journals

1000+ IEEE Journal Titles.

100% Project Output Guaranteed.

Stop worrying about your project output. We provide complete IEEE 2025–2026 journal-based final year project implementation support, from abstract to code execution, ensuring you become industry-ready.

Call Now +91 900 31 31 555

Generative AI Projects for Final Year Happy Students

2,700+ Happy Students Worldwide Every Year