en

Please fill in your name

Mobile phone format error

Bitte geben Sie die Telefonnummer ein!

Bitte geben Sie den Namen Ihres Unternehmens ein

Bitte geben Sie Ihre Unternehmens-E-Mail-Adresse ein

Bitte geben Sie die Datenanforderung ein

Successful submission! Thank you for your support.

Format error, Please fill in again

Confirm

Die Datenanforderung darf nicht weniger als 5 Wörter enthalten und darf keine reinen Zahlen sein.

104 Stunden-Portugiesisch (Brasilien) Spontan-Dialog-Telefonie-Sprachdatensatz

Konversation
Portugiesische asr-Daten
Portugiesischer asr-Datensatz
Portugiesisch

Brasilianisch-portugiesische Sprachdaten_Gespräche (Telefon), simulierte Aufnahmen zu etwa dreißig allgemeinen Themen. Dieser Datensatz ist mit verschiedenen Attributen versehen, wie z. B. Textinhalt, Zeitstempel der Sätze, Identität des Sprechers, Geschlecht usw. Er wurde von 118 brasilianischen Muttersprachlern mit unterschiedlichem geografischen und kulturellen Hintergrund aufgezeichnet, ist sehr genau, stellt eine reichhaltige Ressource für die Forschung und Anwendungen im Bereich der Spracherkennung dar und wurde von mehreren KI-Unternehmen validiert: Er hilft dem Modell, angesichts der Vielfalt in der realen Welt gut abzuschneiden. Wir halten uns strikt an die Datenschutzbestimmungen und -regeln, um sicherzustellen, dass die Privatsphäre und die Rechte der Nutzer bei der Datenerfassung, -speicherung und -verwendung gewahrt bleiben, und zwar in Übereinstimmung mit GDPR, CCPA und PIPL.

Bezahlte Datensätze
Dies ist ein kostenpflichtiger Datensatz für kommerzielle Zwecke, Forschungszwecke und mehr. Lizenzierte, fertige Datensätze helfen, KI-Projekte in Gang zu bringen.
SpezifikationenSpezifikationen
Formatierung
8kHz, 8bit, u-law/a-law pcm, Mono
Klassifizierung des Inhalts
Der Rekorder wählt aus einer spezifischen Themenliste mehrere bekannte Themen aus und nimmt für jedes davon einen fließenden und natürlichen Dialog auf.
Bedingungen für die Aufzeichnung
Relativ ruhiger Innenraum, kein Echo
Erfassungsgeräte
Telefon-Aufnahmesystem
Informationen zum Schreiber
Insgesamt 118 Teilnehmer, davon 64 Männer und 54 Frauen;
Land
Brasilien
Sprachgebiet Code
pt-BR
Sprache
Portugiesisch
Kennzeichnungsmerkmale
Textinhalt-Annotation, Satz-Zeitstempel, Sprecher-Kennzeichnung, Geschlecht, Rauschenssymbol-Annotation
Genauigkeit
98% Wortgenauigkeit
Probe Probe
  • Audio

    Eu lembro que tinha algumas pessoas, e também lembro que eu estava montado numa tartaruga gigante.

  • Audio

    E as carteiras eram ilhas, eu não lembro quem estava lá.

  • Audio

    eu lembro de ter sonhado, que eu estava na minha, é, no meu ensino fundamental, na sala do meu ensino fundamental.

  • Audio

    eu acabo misturando muita fantasia, muitas loucuras. Então um exemplo é, quando eu era jovem,

  • Audio

    e eu lembro que esta sala de aula virou um, um mar, tipo um oceano, na verdade.

Empfohlene DatensätzeEmpfohlener Datensatz
Nennen Sie uns Ihre besonderen Bedürfnisse

Mit dem Absenden erkläre ich mich mit den Datenschutzbestimmungen einverstanden.

4c7a45e5-dcd4-455c-a97f-2c25b4822f5a

74d828ae-db03-4a51-a7ac-219d162562e6