url.c

Branch :
Show log
Commit
Author : Thomas de Grivel
Date : 2024-10-09 14:43:21
Hash : 3591fad0
Message : Facts.open
http/url.c
/* kc3
 * Copyright 2022,2023,2024 kmx.io <contact@kmx.io>
 *
 * Permission is hereby granted to use this software granted the above
 * copyright notice and this permission paragraph are included in all
 * copies and substantial portions of this software.
 *
 * THIS SOFTWARE IS PROVIDED "AS-IS" WITHOUT ANY GUARANTEE OF
 * PURPOSE AND PERFORMANCE. IN NO EVENT WHATSOEVER SHALL THE
 * AUTHOR BE CONSIDERED LIABLE FOR THE USE AND PERFORMANCE OF
 * THIS SOFTWARE.
 */
#include <libkc3/kc3.h>
#include "url.h"

s_str * url_escape (const s_str *src, s_str *dest)
{
  s_buf buf;
  character c;
  s_str *escapes;
  s_tag escapes_tag;
  s_ident ident;
  s_str s;
  sw size;
  u8 u;
  ident_init(&ident, sym_1("URL"), sym_1("escapes"));
  if (! ident_get(&ident, &escapes_tag)) {
    err_puts("url_escape: missing URL.escapes");
    assert(! "url_escape: missing URL.escapes");
    return NULL;
  }
  if (escapes_tag.type != TAG_STR) {
    err_puts("url_escape: URL.escapes is not a Str");
    assert(! "url_escape: URL.escapes is not a Str");
    return NULL;
  }
  escapes = &escapes_tag.data.str;
  if ((size = url_escape_size(src)) < 0)
    return NULL;
  if (! size)
    return str_init_empty(dest);
  if (! buf_init_alloc(&buf, size))
    return NULL;
  s = *src;
  while (str_read_character_utf8(&s, &c) > 0) {
    /* if (c == ' ') { 
         if (buf_write_u8(&buf, '+') < 0)
           goto clean;
       }
       else */
    if (str_character_position(escapes, c) >= 0) {
      if (buf_write_u8(&buf, '%') < 0)
        goto clean;
      u = c;
      if (buf_u8_to_hex(&buf, &u) != 2)
        goto clean;
    }
    else if (buf_write_character_utf8(&buf, c) < 0)
      goto clean;
  }
  tag_clean(&escapes_tag);
  if (! buf_to_str(&buf, dest)) {
    buf_clean(&buf);
    return NULL;
  }
  return dest;
 clean:
  tag_clean(&escapes_tag);
  return NULL;
}

sw url_escape_size (const s_str *src)
{
  character c;
  s_str *escapes;
  s_tag escapes_tag;
  s_ident ident;
  sw r;
  sw result = 0;
  s_str s;
  ident_init(&ident, sym_1("URL"), sym_1("escapes"));
  if (! ident_get(&ident, &escapes_tag)) {
    err_puts("url_escape_size: missing URL.escapes");
    assert(! "url_escape_size: missing URL.escapes");
    return -1;
  }
  if (escapes_tag.type != TAG_STR) {
    err_puts("url_escape_size: URL.escapes is not a Str");
    assert(! "url_escape_size: URL.escapes is not a Str");
    return -1;
  }
  escapes = &escapes_tag.data.str;
  s = *src;
  while ((r = str_read_character_utf8(&s, &c)) > 0) {
    /* if (c == ' ')
         result += 1;
       else */
    if (str_character_position(escapes, c) >= 0)
      result += 3;
    else
      result += r;
  }
  tag_clean(&escapes_tag);
  return result;
}

s_str * url_unescape (const s_str *url, s_str *dest)
{
  character c;
  u8 digit[2];
  s_buf in;
  s_buf out;
  sw r;
  sw size;
  u8 u;
  assert(url);
  assert(dest);
  if ((size = url_unescape_size(url)) < 0)
    return NULL;
  if (! size)
    return str_init_empty(dest);
  if (! buf_init_alloc(&out, size))
    return NULL;
  buf_init_str_const(&in, url);
  while ((r = buf_read_character_utf8(&in, &c)) > 0) {
    if (c == '+') {
      if (buf_write_u8(&out, ' ') < 0)
        goto clean;
    }
    else if (c == '%') {
      if ((r = buf_parse_digit_hex(&in, &digit[0])) <= 0)
        goto ok;
      if ((r = buf_parse_digit_hex(&in, &digit[1])) <= 0)
        goto ok;
      u = digit[0] * 16 + digit[1];
      if (buf_write_u8(&out, u) < 0)
        goto clean;
    }
    else
      if (buf_write_character_utf8(&out, c) < 0)
        goto clean;
  }
 ok:
  buf_to_str(&out, dest);
  return dest;
 clean:
  buf_clean(&out);
  return NULL;
}

sw url_unescape_size (const s_str *url)
{
  character c;
  u8 digit[2];
  s_buf in;
  sw r;
  sw result = 0;
  assert(url);
  buf_init_str_const(&in, url);
  while ((r = buf_read_character_utf8(&in, &c)) > 0) {
    if (c == '%') {
      if ((r = buf_parse_digit_hex(&in, &digit[0])) <= 0 ||
          (r = buf_parse_digit_hex(&in, &digit[1])) <= 0)
        return result;
      result++;
    }
    else
      result += r;
  }
  return result;
}

s_tag * url_www_form_decode (const s_str *src, s_tag *dest)
{
  s_buf buf;
  s_str key = {0};
  s_list *list;
  s_list **tail;
  s_tag tmp = {0};
  s_str value = {0};
  buf_init_str_const(&buf, src);
  list = NULL;
  tail = &list;
  while (1) {
    if (! buf_read_until_1_into_str(&buf, "=", &key))
      break;
    if (! buf_read_until_1_into_str(&buf, "&", &value) &&
        ! buf_read_to_str(&buf, &value)) {
      str_clean(&key);
      goto clean;
    }
    *tail = list_new_tuple(2, NULL);
    (*tail)->tag.data.tuple.tag[0].type = TAG_STR;
    (*tail)->tag.data.tuple.tag[1].type = TAG_STR;
    if (! url_unescape(&key, &(*tail)->tag.data.tuple.tag[0].data.str)) {
      str_clean(&key);
      str_clean(&value);
      goto clean;
    }
    if (! url_unescape(&value,
                       &(*tail)->tag.data.tuple.tag[1].data.str)) {
      str_clean(&key);
      str_clean(&value);
      goto clean;
    }
    str_clean(&key);
    str_clean(&value);
    tail = &(*tail)->next.data.list;
  }
  tmp.type = TAG_LIST;
  tmp.data.list = list;
  *dest = tmp;
  return dest;
 clean:
  list_delete_all(list);
  return NULL;
}
kc3-lang/kc3/http/url.c

Commit

kc3-lang/kc3 /http/url.c