Επιτομή:
Αυτή η διατριβή διερευνά τη σφαίρα της ταξινόμησης ήχου εξετάζοντας σχετικές εργασίες και
διεξάγοντας βασικά πειράματα χρησιμοποιώντας αρχιτεκτονικές Συνελικτικού Νευρωνικού Δικτύου
(CNN) στο σύνολο δεδομένων Urban Sound 8k. Ξεκινάμε παρέχοντας μια επισκόπηση διαφόρων
μεθόδων και συνόλων δεδομένων που χρησιμοποιήθηκαν σε προηγούμενες μελέτες στον τομέα της
ταξινόμησης ήχου. Μετά από αυτήν την ανάλυση, στρέφουμε την εστίασή μας στον πρακτικό
πειραματισμό, εφαρμόζοντας απλά μοντέλα CNN για να διερευνήσουμε την ικανότητά τους στην
ταξινόμηση των αστικών ήχων. Τα μοντέλα μας αξιολογούνται χρησιμοποιώντας μετρικες όπως το
F1-score και η ακρίβεια, παρέχοντας μια ποσοτική αξιολόγηση της απόδοσής τους. Τα
αποτελέσματα, αν και είναι προκαταρκτικά, δείχνουν ενθαρρυντικά σημάδια, υποδεικνύοντας ότι
ακόμη και απλά μοντέλα CNN μπορούν να είναι κάπως αποτελεσματικά σε εργασίες ταξινόμησης
ήχου.