Bu Python kodu, temel olarak bilgisayarınızın kamerasını bir "göz" gibi kullanarak çevresindeki dünyayı anlamasını sağlar. Yaptığı ana işler şunlardır:
Kamerayı Açma ve İzleme: Bilgisayarınıza bağlı olan varsayılan web kamerasını (genellikle laptop kamerası veya harici bir USB kamera) çalıştırır ve oradan sürekli olarak video görüntüleri almaya başlar. Anlık Görüntüleri Analiz Etme: Kameradan gelen video akışını tek tek fotoğraf karelerine ayırır. Her bir kareyi çok hızlı bir şekilde analiz eder. Nesneleri Tanıma (Yapay Zeka Kullanımı): Her bir fotoğraf karesini, önceden milyonlarca görüntü ile eğitilmiş YOLOv8 adlı güçlü bir yapay zeka modeline gönderir. Bu model, görüntüdeki tanıdık nesneleri (insanlar, arabalar, bardaklar, klavyeler, kediler vb.) tespit edebilir. Nesneleri İşaretleme: Model bir nesne bulduğunda, o nesnenin görüntüdeki yerini belirler ve etrafına yeşil bir kutu (dikdörtgen) çizer. Nesneleri Etiketleme: Çizdiği kutunun üzerine, bulduğu nesnenin adını (etiketini, örn: "person", "cup") ve modelin bu tahminden ne kadar emin olduğunu (güven skorunu, örn: %95) yazar. Canlı Görüntüleme: Tüm bu işaretlemeler ve etiketlemeler yapılmış olan işlenmiş video karesini, bilgisayarınızın ekranında "Next Vision" adında bir pencerede canlı olarak gösterir. Yani siz kameranın önünde hareket ettikçe veya yeni nesneler geldikçe, program bunları anında tespit edip size gösterir. Bilgi Verme (Terminal): Aynı zamanda, o an görüntüde hangi nesnelerin tespit edildiğini ve güven skorlarını metin olarak programı çalıştırdığınız terminal ekranına (siyah komut istemi penceresi gibi) yazar. Hızlandırma (GPU Kullanımı): Eğer bilgisayarınızda desteklenen bir ekran kartı (Nvidia GPU) varsa, bu karmaşık analiz işlemini çok daha hızlı yapmak için GPU'yu kullanır. Yoksa normal işlemci (CPU) ile çalışır ama biraz daha yavaş olabilir. Kontrollü Durdurma: Program çalışırken 'q' tuşuna basarak istediğiniz zaman programı güvenli bir şekilde durdurmanızı sağlar ve kullandığı kamera kaynağını serbest bırakır. Özetle: Bu kod, bilgisayarınıza gerçek zamanlı olarak görme ve gördüğü nesneleri tanıma yeteneği kazandıran bir yapay zeka uygulamasıdır.
English Explanation:
What This Code Does: Real-Time Webcam Object Detection with YOLOv8 This Python code essentially allows your computer to "see" and understand the world around it using its webcam as an "eye." Here are the main things it does:
Opens and Monitors the Camera: It activates the default webcam connected to your computer (usually the built-in laptop camera or an external USB one) and starts continuously capturing video frames from it. Analyzes Live Images: It takes the incoming video stream and breaks it down into individual still images (frames). It analyzes each frame very quickly. Recognizes Objects (Using Artificial Intelligence): It sends each captured frame to a powerful Artificial Intelligence (AI) model called YOLOv8, which has been pre-trained on millions of images. This model can identify common objects within the image (like people, cars, cups, keyboards, cats, etc.). Highlights Objects: When the model finds an object, it determines its location in the image and draws a green box (rectangle) around it. Labels Objects: Above the box it draws, it writes the name (label) of the object it found (e.g., "person," "cup") and how confident the model is about that detection (the confidence score, e.g., 95%). Displays Live Feed: It shows the processed video frame, complete with all the boxes and labels, live on your computer screen in a window titled "Next Vision." This means as you move or as new objects appear in front of the camera, the program detects and shows them almost instantly. Provides Information (Terminal): Simultaneously, it prints a list of the objects detected in the current frame, along with their confidence scores, as text to the terminal window (like the black command prompt window) where you ran the program. Accelerates Processing (GPU Usage): If your computer has a compatible graphics card (Nvidia GPU), it uses the GPU to perform these complex analysis tasks much faster. If not, it runs on the regular processor (CPU), which might be a bit slower. Allows Controlled Stopping: It lets you safely stop the program anytime by pressing the 'q' key while the display window is active, ensuring it properly releases the camera resource afterward. In summary: This code is an AI application that gives your computer the ability to see and recognize objects in its environment in real-time.
Model tree for NextGenC/NextVision
Base model
Ultralytics/YOLOv8