Simple Machines Community Forum

SMF Support => Language Specific Support => Ελληνικά (Greek) => Topic started by: sem27gr on October 02, 2006, 02:18:33 PM

Title: UTF-8 vs ISO
Post by: sem27gr on October 02, 2006, 02:18:33 PM
Δημιουργώ αυτό το τόπικ για να κάνω μια ερώτηση που δεν έχω καταλάβει πλήρως από ότι φαίνεται!

Όταν ξεκίνησα να φτιάχνω το forum μου (της σχολής μου), είχα πάει σε proboards φόρουμ. Εν τέλη μισθώσαμε κάποιο site (www.agrobioaua.com) και βάλαμε εκεί το forum. Ήξερα λοιπόν ότι με utf-8 κωδικοποίηση θα έχω σίγουρα όλεα τα είδη γλωσσών (μπορεί κ να κάνω λάθος). Δημιουργώντας λοιπόν την database μου, την έφτιαξα εξ αρχής σε UTF-8. Έβαλα το 1.1RC3 και κατέβασα τα ελληνικά τα οποία ήταν και αυτά UTF-8 και επιβεβαιώθηκε η θεωρία μου.

Στην πορεία και ψάχνωντας το θέμα περισσότερο κατάλαβα ότι και με ISO λειτουργούν τα Ελληνικά...
Τα email που στέλνουμε συνήθως έχουν κωδικοποίηση iso. Και έχω την εξής ερώτηση:

Γιατί να κάνω το forum μου iso, και όχι uft8 αφού το με το utf8 θα έχω μεγαλύτερη συμβατότητα;

Αν τελικά πρέπει να αλλάξω την κωδικοποίηση μου σε iso, γίνεται ή την πάτησα και πρέπει να συνεχίσω με utf8?

Τέλος παρατήρησα ότι όταν στον explorer έχεις επιλέξει utf8, δεν βλέπει τα iso και αντίστροφα. Αντιμετωπίζοντας έτσι το πρόβλημα ότι πρέπει κάποιος να παίζει συνέχεια με τα encodings, πράγμα εκνευριστικό!

Ευχαριστώ εκ των προτέρων.....
Σταμάτης
Title: Re: UTF-8 vs ISO
Post by: GoofyX on October 03, 2006, 04:27:59 PM
Το utf-8 ως encoding είναι το μέλλον, διότι χωρά όλες τις γλώσσες του κόσμου (ή σχεδόν όλες, δεν μπορώ να είμαι σίγουρος), λόγω των 65.536 εν δυνάμει χαρακτήρων που μπορεί να αποθηκεύσει. Αυτό πρακτικά τι σημαίνει; Ότι σε ένα site (πχ. php/MySQL) για παράδειγμα έχεις ένα σύνολο αρχείων για όλες τις γλώσσες που θα ήθελες να απεικονίσεις, αν και αυτό που αναφέρω ως πρακτική δεν χρησιμοποιείται, δεν μπλέκεις ποτέ τη λογική μιας εφαρμογής (η δυναμική σελίδα) με το output (τα μηνύματα στο html) που θα εμφανίσει, άρα απλά συντηρείς πολλά αρχεία μηνυμάτων για ένα αρχείο της λογικής (ελπίζω να γίνομαι κατανοητός). Βασικά το πλεονέκτημα είναι ότι υποστηρίζεις όλες τις γλώσσες με τη μία.

Το μειονέκτημα είναι ότι θα σου πιάνει (σχεδόν) διπλάσιο χώρο, γιατί η κωδικοποίηση ενός όχι λατινικού χαρακτήρα (πχ. ελληνικά, κινέζικα, κτλ.) θα πιάνει 2 bytes, αντί για 1 στην περίπτωση του ISO-8859-7. Διπλάσιος χώρος και στο αρχείο μηνυμάτων και στη βάση και στο output (άρα περισσότερο bandwidth).

Πού καταλήγουμε; Αν θες ελληνικά και αγγλικά, πάνε σε ISO-8859-7, αν θες πολλές γλώσσες, σε utf-8. Απλά επειδή τίνουμε να καταλήξουμε σε ένα στάνταρ (με τη μορφή του ενός, όχι του προτύπου) τύπο, αυτό θα είναι κάτι σε unicode, utf-8 προς το παρόν.

Αυτά. :)
Title: Re: UTF-8 vs ISO
Post by: sem27gr on October 03, 2006, 04:46:56 PM
Κατάλαβα ωραία....όπως εξελίσσονται τα πράγματα, όλοι πλέον έχουν dsl και όλα φορτώνουν γρήγορα. Όσον αφορά τον χώρο, έχω μπόλικο στο site. Οπότε προς το παρόν το αφήνω σε utf8

Από ότι κατάλαβα, θα μπορέσω αν κάποια στιγμή το θελήσω να το μετατρέψω σε iso πολύ απλά έτσι;
Title: Re: UTF-8 vs ISO
Post by: GoofyX on October 03, 2006, 04:58:42 PM
Quote from: sem27gr on October 03, 2006, 04:46:56 PM
Από ότι κατάλαβα, θα μπορέσω αν κάποια στιγμή το θελήσω να το μετατρέψω σε iso πολύ απλά έτσι;

Χμ... Όχι ακριβώς. Σκέψου ότι για ένα χαρακτήρα πρέπει να στριμώξεις 2 bytes σε 1. Δεν είναι και τόσο απλό ε; Ενώ το αντίθετο είναι. Εύκολα μετατρέπεις 1-byte encoding σε multi-byte. Φυσικά και γίνεται η μετατροπή που θέλεις, απλά είναι λίγο παίδεμα παραπάνω. Προτείνω να το αφήσεις ως έχει.
Title: Re: UTF-8 vs ISO
Post by: leftezi on October 06, 2006, 10:41:21 AM
Μόνο και μόνο σαν στάνταρ το UTF8 λέει πολλά.
Μακάρι να καθιερωθεί. Αν τα προγράμματα ήταν εξαρχής φτιαγμένα για UTF8 δε θα είχαμε όλα αυτά τα μηνύματα και τα ψαξίματα με τα προβλήματα ελληνικών. Μακάρι να το ακολουθήσουν και άλλες συσκευές (Mp3 players - TV Teletext κτλ.) να ξεμπερδεύουμε μια και καλή αποφεύγοντας ειδικές ρυθμίσεις και ειδικές εκδόσεις σε κάθε πρόγραμμα και συσκευή.
Κράτα το, έτσι για να γίνουμε πολλοί. ;D
Title: Re: UTF-8 vs ISO
Post by: sem27gr on October 06, 2006, 02:26:22 PM
 :D
Title: Re: UTF-8 vs ISO
Post by: agridoc on October 09, 2006, 02:15:01 PM
Δεν νομίζω οτι το UTF-8, εκτός από περιπτώσεις όπου πραγματικά χρειάζεται, θα προσφέρει κάτι, τουλάχιστον στο άμεσο μέλλον.

Η λογική είναι οτι πληρώνεις (σε χώρο και ταχύτητα) για κάτι που δεν χρειάζεσαι.

Επιπλέον δεν έχει καθιερωθεί, ούτε βλέπω να καθιερώνεται, σαν στάνταρντ στα PC στην Ελλάδα αλλά και χώρες με πολύ μεγαλύτερο πληθυσμό.