Files

3.0 KiB

id, title, challengeType, forumTopicId, dashedName
id title challengeType forumTopicId dashedName
594faaab4e2a8626833e9c3d Tokenizar uma string com escape 5 302338 tokenize-a-string-with-escaping

--description--

Escreva uma função ou programa que possa dividir uma string em cada ocorrência sem escape de um caractere separador.

Ela deve aceitar três parâmetros de entrada:

  • A string
  • O caractere separador
  • O caractere de escape

Ela deve ter como saída uma lista de strings.

Regras para a divisão:

  • Os campos que foram separados pelos separadores se tornam os elementos da lista de saída.
  • Campos vazios devem ser preservados, mesmo no início e no fim.

Regras para o escape:

  • Com "escape" significa precedido por uma ocorrência do caractere de escape, que já não estiver escapado por si mesmo.
  • Quando o caractere de escape preceder um caractere que não tem nenhum significado especial, ele ainda conta como um escape (mas não faz nada especial).
  • Cada ocorrência do caractere de escape que for usada para fazer o escape de algo não deve se tornar parte do resultado.

Demonstre que sua função satisfaz o seguinte caso de teste:

Dada a string

one^|uno||three^^^^|four^^^|^cuatro|

e usando | como separador e ^ como caractere de escape, a função deve dar como resultado o seguinte array:

  ['one|uno', '', 'three^^', 'four^|cuatro', '']

--hints--

tokenize deve ser uma função.

assert(typeof tokenize === 'function');

tokenize deve retornar um array.

assert(typeof tokenize('a', 'b', 'c') === 'object');

tokenize('one^|uno||three^^^^|four^^^|^cuatro|', '|', '^') deve retornar ['one|uno', '', 'three^^', 'four^|cuatro', '']

assert.deepEqual(tokenize(testStr1, '|', '^'), res1);

tokenize('a@&bcd&ef&&@@hi', '&', '@') deve retornar ['a&bcd', 'ef', '', '@hi']

assert.deepEqual(tokenize(testStr2, '&', '@'), res2);

--seed--

--after-user-code--

const testStr1 = 'one^|uno||three^^^^|four^^^|^cuatro|';
const res1 = ['one|uno', '', 'three^^', 'four^|cuatro', ''];

// TODO add more tests
const testStr2 = 'a@&bcd&ef&&@@hi';
const res2 = ['a&bcd', 'ef', '', '@hi'];

--seed-contents--

function tokenize(str, sep, esc) {
  return true;
}

--solutions--

// tokenize :: String -> Character -> Character -> [String]
function tokenize(str, charDelim, charEsc) {
  const dctParse = str.split('')
    .reduce((a, x) => {
      const blnEsc = a.esc;
      const blnBreak = !blnEsc && x === charDelim;
      const blnEscChar = !blnEsc && x === charEsc;

      return {
        esc: blnEscChar,
        token: blnBreak ? '' : (
          a.token + (blnEscChar ? '' : x)
        ),
        list: a.list.concat(blnBreak ? a.token : [])
      };
    }, {
      esc: false,
      token: '',
      list: []
    });

  return dctParse.list.concat(
    dctParse.token
  );
}