mirror of
https://github.com/freeCodeCamp/freeCodeCamp.git
synced 2026-02-27 11:04:01 -05:00
3.0 KiB
3.0 KiB
id, title, challengeType, forumTopicId, dashedName
| id | title | challengeType | forumTopicId | dashedName |
|---|---|---|---|---|
| 594faaab4e2a8626833e9c3d | Tokenisierung einer Zeichenkette mit Escaping | 1 | 302338 | tokenize-a-string-with-escaping |
--description--
Write a function or program that can split a string at each non-escaped occurrence of a separator character.
Sie sollte drei Eingabeparameter akzeptieren:
- The string
- The separator character
- The escape character
Es sollte eine Liste von Zeichenketten ausgeben.
Regeln für die Aufteilung:
- The fields that were separated by the separators, become the elements of the output list.
- Leere Felder sollten beibehalten werden, auch am Anfang und am Ende.
Regeln für die Flucht:
- "Escaped" means preceded by an occurrence of the escape character that is not already escaped itself.
- Wenn das Escape-Zeichen vor einem Zeichen steht, das keine besondere Bedeutung hat, gilt es trotzdem als Escape-Zeichen (hat aber keine besondere Wirkung).
- Jedes Vorkommen des Escape-Zeichens, das verwendet wurde, um etwas zu entkommen, sollte nicht Teil der Ausgabe werden.
Zeige, dass deine Funktion den folgenden Testfall erfüllt:
Angesichts der Zeichenkette
one^|uno||three^^^^|four^^^|^cuatro|
und unter Verwendung von | als Trennzeichen und ^ als Escape-Zeichen, sollte deine Funktion die folgende Anordnung ausgeben:
['one|uno', '', 'three^^', 'four^|cuatro', '']
--hints--
tokenize sollte eine Funktion sein.
assert(typeof tokenize === 'function');
tokenize sollte ein Array zurückgeben.
assert(typeof tokenize('a', 'b', 'c') === 'object');
tokenize('one^|uno||three^^^^|four^^^|^cuatro|', '|', '^') sollte ['one|uno', '', 'three^^', 'four^|cuatro', ''] zurückgeben
assert.deepEqual(tokenize(testStr1, '|', '^'), res1);
tokenize('a@&bcd&ef&&@@hi', '&', '@') sollte ['a&bcd', 'ef', '', '@hi'] zurückgeben
assert.deepEqual(tokenize(testStr2, '&', '@'), res2);
--seed--
--after-user-code--
const testStr1 = 'one^|uno||three^^^^|four^^^|^cuatro|';
const res1 = ['one|uno', '', 'three^^', 'four^|cuatro', ''];
// TODO add more tests
const testStr2 = 'a@&bcd&ef&&@@hi';
const res2 = ['a&bcd', 'ef', '', '@hi'];
--seed-contents--
function tokenize(str, sep, esc) {
return true;
}
--solutions--
// tokenize :: String -> Character -> Character -> [String]
function tokenize(str, charDelim, charEsc) {
const dctParse = str.split('')
.reduce((a, x) => {
const blnEsc = a.esc;
const blnBreak = !blnEsc && x === charDelim;
const blnEscChar = !blnEsc && x === charEsc;
return {
esc: blnEscChar,
token: blnBreak ? '' : (
a.token + (blnEscChar ? '' : x)
),
list: a.list.concat(blnBreak ? a.token : [])
};
}, {
esc: false,
token: '',
list: []
});
return dctParse.list.concat(
dctParse.token
);
}