Files
freeCodeCamp/curriculum/challenges/ukrainian/22-rosetta-code/rosetta-code-challenges/tokenize-a-string-with-escaping.md
2024-02-19 19:27:27 -06:00

3.8 KiB
Raw Blame History

id, title, challengeType, forumTopicId, dashedName
id title challengeType forumTopicId dashedName
594faaab4e2a8626833e9c3d Токенізація рядка символами екранування 1 302338 tokenize-a-string-with-escaping

--description--

Напишіть функцію або програму, яка може поділити рядок кожного разу, коли зустрічається неекранований відокремлювальний символ.

Вона має приймати три вхідні параметри:

  • рядок
  • відокремлювальний символ
  • символ екранування

Вона має вивести список рядків.

Правила для відокремлення:

  • Поля, розділені відокремлювальними символами, стають елементами вихідного списку.
  • Порожні поля мають зберегтись, навіть спочатку та вкінці.

Правила для екранування:

  • «Екранованим» вважають символ, якщо перед ним стоїть символ екранування, який сам не є екранованим.
  • Якщо символ екранування передує символу, який не має особливого значення, він все одно вважається символом екранування (але не робить нічого особливого).
  • Частиною вихідних даних не повинен бути кожен випадок, коли символ екранування було використано для екранування.

Доведемо, що функція задовольняє такий випадок:

Дано рядок

one^|uno||three^^^^|four^^^|^cuatro|

використовуючи | як відокремлювальний символ та ^ як символ екранування, функція має вивести наступний масив:

  ['one|uno', '', 'three^^', 'four^|cuatro', '']

--hints--

tokenize має бути функцією.

assert(typeof tokenize === 'function');

tokenize має повернути масив.

assert(typeof tokenize('a', 'b', 'c') === 'object');

tokenize('one^|uno||three^^^^|four^^^|^cuatro|', '|', '^') має повернути ['one|uno', '', 'three^^', 'four^|cuatro', '']

assert.deepEqual(tokenize(testStr1, '|', '^'), res1);

tokenize('a@&bcd&ef&&@@hi', '&', '@') має повернути ['a&bcd', 'ef', '', '@hi']

assert.deepEqual(tokenize(testStr2, '&', '@'), res2);

--seed--

--after-user-code--

const testStr1 = 'one^|uno||three^^^^|four^^^|^cuatro|';
const res1 = ['one|uno', '', 'three^^', 'four^|cuatro', ''];

// TODO add more tests
const testStr2 = 'a@&bcd&ef&&@@hi';
const res2 = ['a&bcd', 'ef', '', '@hi'];

--seed-contents--

function tokenize(str, sep, esc) {
  return true;
}

--solutions--

// tokenize :: String -> Character -> Character -> [String]
function tokenize(str, charDelim, charEsc) {
  const dctParse = str.split('')
    .reduce((a, x) => {
      const blnEsc = a.esc;
      const blnBreak = !blnEsc && x === charDelim;
      const blnEscChar = !blnEsc && x === charEsc;

      return {
        esc: blnEscChar,
        token: blnBreak ? '' : (
          a.token + (blnEscChar ? '' : x)
        ),
        list: a.list.concat(blnBreak ? a.token : [])
      };
    }, {
      esc: false,
      token: '',
      list: []
    });

  return dctParse.list.concat(
    dctParse.token
  );
}