Phát hiện ML
Mô hình Hugging Face Transformer
Phát hiện học máy của chúng tôi sử dụng các mô hình transformer tiên tiến được đào tạo trên hàng triệu hình ảnh để phân biệt ảnh thực với nội dung do AI tạo ra.
Cách Hoạt Động
Mạng neural phân tích các mẫu hình ảnh, kết cấu và các artifact tinh vi mà mắt người không thể nhìn thấy nhưng đặc trưng cho việc tạo AI. Nó kiểm tra các đặc điểm cấp pixel, phân bố màu sắc và các mẫu cấu trúc.
Image Input
Upload any image file
Preprocessing
Resize and normalize
Analysis
Transformer model inference
Result
AI probability score
Technical Specifications
Model Details
- Model ViT-based Classifier
- Source Hugging Face
- Training Data 1M+ images
- Processing CPU-optimized
Detection Capabilities
- Stable Diffusion variants
- Midjourney outputs
- DALL-E generations
- Other diffusion models
Frequently Asked Questions
What is Machine Learning detection for AI images?
ML detection uses trained neural networks (specifically Vision Transformers) to analyze images and identify patterns characteristic of AI-generated content, such as those from Stable Diffusion, DALL-E, or Midjourney.
Why is ML detection weighted at 40%?
ML detection is our most accurate single method, trained on millions of images. It achieves 92-98% accuracy on direct AI outputs, making it the primary signal in our ensemble detection system.
What AI generators can ML detection identify?
Our ML model detects images from Stable Diffusion (all versions), DALL-E 2 & 3, Midjourney, Adobe Firefly, Leonardo.ai, and most diffusion-based generators.
How does the Vision Transformer work?
Vision Transformers (ViT) divide images into patches and learn attention patterns between them. They can identify subtle correlations that differ between AI-generated and real photographs.
Does image compression affect ML detection?
Moderate JPEG compression (quality 60-100) has minimal impact. Heavy compression or multiple re-compressions can reduce accuracy, which is why we use ensemble methods.
What image formats are supported?
We support JPEG, PNG, WebP, BMP, and TIFF formats. All images are preprocessed to 224x224 pixels while preserving aspect ratio for optimal model inference.
How fast is the ML detection?
Our CPU-optimized model processes images in under 500ms. GPU acceleration can reduce this to under 50ms for batch processing.
Can ML detection identify edited photos?
ML detection focuses on fully AI-generated images. For AI-enhanced or partially edited photos, other methods like clone detection work better.
Is the model updated for new AI generators?
Yes, we regularly retrain our models to include outputs from the latest AI image generators. The current model is trained on images from 2024-2026 generators.
What is the false positive rate?
Our ML model has a false positive rate under 2% for standard photographs. Heavily filtered or stylized photos may occasionally trigger false positives, which ensemble methods help mitigate.
Phương pháp liên quan
Phân tích PRNU
PRNU phát hiện dấu vân tay cảm biến máy ảnh độc đáo từ lỗi sản xuất. Hình ảnh AI không thể sao chép các chữ ký cảm biến thực này.
Phân tích tần số
Phân tích miền tần số kiểm tra sự phân bố của các thành phần tần số cao và thấp trong hình ảnh. Hình ảnh AI thường thiếu nhiễu tần số cao tự nhiên có trong ảnh thực.
Phân tích gradient
Phân tích các mẫu cạnh và đặc điểm kết cấu sử dụng toán tử Sobel, Canny và Laplacian. Hình ảnh AI thường có gradient mượt hoặc đồng nhất không tự nhiên.
Mẫu nhiễu
Ảnh thực chứa các mẫu nhiễu độc đáo từ cảm biến máy ảnh. Hình ảnh AI có phân bố nhiễu đồng nhất không tự nhiên.
Phân tích siêu dữ liệu
Metadata hình ảnh chứa manh mối quý giá về nguồn gốc. Chúng tôi phân tích dữ liệu EXIF, chữ ký phần mềm để xác định công cụ tạo AI.
Dấu vân tay GAN
Phát hiện các artifact đặc trưng của GAN như mẫu bàn cờ, dải màu và bất thường phổ đặc trưng của mạng đối kháng tạo sinh.
Phân tích kết cấu
Phân tích Local Binary Pattern cho các bất thường kết cấu phổ biến trong hình ảnh AI. Đo lường độ đồng nhất, entropy và tính đồng nhất.
Phát hiện giải phẫu
Trình tạo hình ảnh AI thường tạo ra lỗi giải phẫu. Chúng tôi sử dụng thị giác máy tính để phát hiện những sai sót này.
Xác minh C2PA
C2PA là tiêu chuẩn công nghiệp để theo dõi nguồn gốc và lịch sử nội dung số thông qua chữ ký mã hóa.
Semantic Inconsistency Detection
Detects logical inconsistencies like incorrect shadows, impossible perspectives, distorted reflections, and violations of physical laws that AI often produces.
Human Biometric Analysis
Uses MediaPipe to analyze human anatomy for incorrect finger counts, asymmetric eyes, unnatural skin texture, and other anatomical anomalies common in AI-generated faces.
Lighting Physics Validation
Validates light source consistency, shadow direction physics, specular highlight accuracy, and color temperature uniformity across the image.
Compression Artifact Analysis
Analyzes JPEG compression artifacts to estimate quality levels and detect re-compression patterns that indicate image manipulation or AI generation.
Edge Sharpness Analysis
Analyzes sharpness distribution across the image and validates depth-of-field consistency. AI often produces unnaturally uniform sharpness.
Statistical Pattern Analysis
Analyzes statistical properties including Shannon entropy, histogram patterns, and Benford's Law compliance to detect synthetic image characteristics.
Chromatic Aberration Analysis
Detects the absence of chromatic aberration (color fringing) that real camera lenses produce. AI images lack these optical artifacts.
Micro-Texture Analysis
Analyzes microscopic texture patterns for repetition, uniformity, and unnatural randomness that AI generators often exhibit.
Color Palette Analysis
Analyzes color distribution including saturation levels, color diversity, and white balance consistency. AI images often have oversaturated colors.
Kiểm Tra Hình Ảnh Của Bạn
Tất cả phương pháp được kết hợp sử dụng điểm có trọng số để đưa ra phán quyết cuối cùng với mức độ tin cậy.
Thử Ngay