Erst gemeinte Frage (Ich bin ja kein Deutschlehrer). Nachdem ich den Link gelesen habe:
Y ist also ein Vokal?
<y> ist erst einmal ein Buchstabe (ein Graphem) und somit weder ein Vokal noch ein Konsonant, was Bezeichnungen für Laute (Phoneme) sind (sprachwissenschaftlich betrachtet, nicht umgangssprachlich).
In der Graphem-Phonem-Korrespondenz des Deutschen kann das <y> verschiedene Phoneme repräsentieren, zum Beispiel:
1. /j/ wie in "Yoga"
2. /y/ wie in "Physik"
3. /yː/ wie in "Mythos"
4. /i/ wie in "Baby"
5. zusammen mit <a>: /aɪ̯/ wie in "Bayern"
6. zusammen mit <e>: /ɛɪ̯/ wie in "Hey"
Bei Nummer eins korrespondiert das <y> mit einem Konsonanten, bei den Nummern zwei bis vier mit verschiedenen Vokalen, bei den Nummern fünf und sechs mit Diphthongen.
Falls ich eine weitere Möglichkeit übersehen habe, gerne ergänzen.
Dem Wikipedia-Artikel entnehme ich, dass nur die beiden Diphthong-Varianten ursprünglich aus der deutschen Sprache stammen, während die anderen nur in Lehn- und Fremdwörtern vorkommen.
Um noch etwas didaktisch zu sagen, nachdem mir hier vorgehalten wurde, ich würde dies vernachlässigen:
Kindern im Schriftspracherwerb kann man am Anfang die Faustregel vermitteln, dass ein <y> am Wortanfang fast immer als [j] ausgesprochen wird, in der Wortmitte fast immer als [y] (selten als [yː]) und am Wortende fast immer als immer als [i]. Trifft natürlich dann schon nicht mehr zu, wenn wir uns Komposita anschauen.