LE BAIN MARIE

Monday, March 9, 2009

Barnes&Noble svarer igen

I sidste uge lancede Amazon Kindle til iPhone. Applikationen er gratis og sandsynligvis vil den føre til langt større ebogssalg for Amazon, nu hvor man ikke behøver anskaffe sig apparatet. Tror jeg nok. For applikationen sælges kun i USA og er angiveligt tænkt som et supplement til en Kindle 2.

Hvorom alting er, så har den store amerikanske boghandlerkæde Barnes&Noble i dag meddelt, at de har købt nettes største eboghandel, fictionwise.com af Steve og Scott Pendergast.

Den fremragende ereader-applikation, der hedder Stanza, har direkte integration med Fictionwise - en salgsmodel der svarer til Kindlens, der som den eneste fysiske reader har været online og med direkte adgang til en shop. Stanza er downloadet mere end 1,3 mio. gange. Stanza fås endnu kun til iPhone og iPod Touch, men de lover ...

I forhold til Kindle kan Stanza læse både epub-filer og pdf-filer, hvor Amazon fastholder og promoverer sin version af det mindre fleksible mobipocket-format. I parentes bemærket, så ejer Amazon mobipocket). Og ikke mindst kan Stanza læse DRM-frie titler, så man ikke er tvunget til at købe alle sine bøger i én og samme boghandel. Fictionwise sælger DRM-frie bøger. Det skal blive interessant at se, om B&N kan holde sig i skindet og fortsætte denne kurs med at tillade salg af DRM-frie ebøger.

Men det er i alle tilfælde et stærkt træk og betryggende at se at Amazon – i hvert fald ikke uimodsagt – kan løbe med bolden

Wednesday, February 11, 2009

Start With XML-projektet

Tirsdagens mest entusiastiske oplæg kom fra et firkløver bestående af Mike Shatzkin (The Idea Logical Company, Inc.), Laura Dawson (LJNDawson), Brian O'Leary (Magellan Media), Ted Hill (THA Consulting). Firkløveret har stået for udarbejdelsen af en rapport, StartWithXML, der handler om indørelsen af XML i workflowet på et forlag. I projektet har der været gennemført en undersøgelse, hvor 165 forlag deltog (små som store), der er etableret en hjemmeside og en blog og der blev afholdt et symposium i januar måned.

Og nu foreligger rapporten altså - som ebog. Man kan købe den hos O'Reilly. Som det er gængs praksis hos O'Reilly, får man værket i 3 formater, når man køber ebogen: pdf, mobipocket og epub. Det kalder de et ebook bundle, og det opfattes som ét produkt

De store fordele ved at indføre XML-workflow er dem, vi har hørt mange gange:

fleksibilitet i produktionen
singlesource-publishing
langt mere fleksibel genudnyttelse af indhold
udvikling af nye produkter

Et nøgleord er fleksibilitet (den engelske term der bruges i rapporten er agility).

Oplægget, der hed XML Recommendations and Lessons Learned bestod - ikke overraskende - af en række highlights og teasers fra rapporten. Disse var bl.a.:

oversigt over hvor stor "relativ fleksibilitet" man får ud af at etablere et XML-workflow i sit forlag
forretningsperspektivet: where's the money?
identifikation af svagheder og mangler i eksisterende workflows
hvor i workflowet sætter man ind med xml?
hvem opmærker?
hvad opmærker man?
hvordan måler man de opnåede fordele?

Jeg tror at vi med StartWithXML-rapporten, endelig har fået en omfattende og dækkende analyse af, hvad der egentlig skal til og hvad man overhovedet får ud af dét. Med den i hånden vil man være bedre i stand til at afgøre om det overhovedet er fornuftigt - og i så fald hvor, hvordan og hvor meget. Jeg ser frem til at læse den.

Tuesday, February 10, 2009

Mandag i ebøgernes tegn

I dag, mandag, blev dagen hvor amazon ved et pressemøde i Morgan Library på Manhattan, præsenterede version 2 af deres ebogslæser Kindle. Den nye Kindle ser knap så klodset ud som den første og har fået tilført en hel del ny funktionalitet. Den første Kindle er sandsynligvis solgt i ca. 500.000 eksemplarer, og på Amazon kan man købe ca. 250.000 titler som ebøger. Kindle kan dog ikke læse standard-ebogsformatet epub som en række andre forlag og forhandlere ancender og opfordrer til at anvende. Det er synd, og også i mine øjne en fejl.

Mandag var også tutorialdag ved Tools of Change for Publishing-konferencen, der afholdes på et hotel på den overbelyste og opskørtede Times Square. I formiddags fulgte jeg en tutorial om ebøger (strategi og forretningsmodeller). Det var spændende og lærerigt, selv om det stadig er tydeligt, at branchen er noget famlende over for valg af løsninger.

Der var hele 4 personer, der optrådte:

Michael Smith fra IDPF (= International Digital Publishing Forum)
Kenneth Brooks fra Cengage Learning (det tidligere Thompson Learning)
Leslie Hulse fra HarperCollins Publishers
Cynthia Cleto fra Springer Business & Media

Michael Smith lagde ud med at fortælle om epub-formatet, som er et standardformat for ebøger, der blev lanceret i 2008 og som en række store forlag bakker op om. Standarden udvikles og vedligeholdes under iDPF. Derefter tog de tre forlagsfolk over, og resten af forestillingen handlede om

hvor er forretningen
hvad karakteriserer forretningsområdet
Forretningsmodeller
Valg af dataformat
igangværende eksperimenter
…

De tre beskrev de hver for sig de faktorer, der var karakteristiske for 4 forretningsområder:

Trade-publishing, repræsenteret af HarperCollins
Higher Ed(ucation), som Cengage Learning fortalte om
Reference works ("opslagsværker"), som Cengage også tog sig af
STM (=Scientific/Technical/Medical), som Springer repræsenterede. Forlag i STM-branchen har typisk allerede etablerede onlineplatforme med velfungerende forretningsmodeller fordi de i årevis har solgt abonnementer på videnskabelige tidsskrifter på den måde.

Det skal hér nævnes, at begrebet "ebog" viste sig at dække over både downloadede ebogsfiler og over digitale bogudgaver, der gøres tilgængelige online, og forskellige mellemformer.

Det var rigtig interessant, og der er virkelig stor forskel på

hvem der sælges til (slutbruger/forhandler/bibliotek)
hvad der tjenes (indtjeningen på ebøger i forhold til indtjeningen på tilsvarende fysiske udgaver varierede fra Trade-områdets sølle 1% til Opslagsværkernes 60%)
hvordan man sælger varen
hvor synligt ens produkt er - og ad hvilke veje brugerne evt. finder frem til én

og mange andre interessante ting.

inden for hvert emne, vistes et skema med forskellige parametre i rækker og med med en kolonne for hvert af de fire forretningsområder. Der var i øvrigt et par ting, der var værd at bemærke:

Hos Cengage Learning har de et helt ille hold af mennesker ("library scientists"), der udelukkende beskæftiger sig med at tilføje relevante nøgleord til titlerne, så de bliver synlige ved søgning og linking. (Som Kenneth Brooks sagde: "Authors are terrible indexers. You need Professionals!")
Hos HarperCollins arbejder et helt hold udelukkende med kontrakter, rettigheder (også digitale og internationale) og royalties.

Det helt geniale er, at foredragsholderne har etableret en wiki med alt materialet, som man finder hér. Her kan alle gå ind og læse de flotte oversigter, som man med fordel kan bruge til at analysere sine egne forretningområder, før man vælger forretningsmodel osv. Prøv at kigge ind - man får et virkelig godt overblik

Eftermiddagens tutorial handlede om standarder for og implementering af ebøger. Det var faktisk lidt kedeligt … På den nørdede gaaaab-måde … Men et rigtig værkstedskursus om

epub-standardens fortræffeligheder og begrænsninger
kunsten at opmærke en bog i det begrænsede mobipocketformat, der kan læses på en Kindle
Kunsten at tilføre epub-bøger merværdi i form af massiv linking, udvidede indholdsfortegnelser, generisk kodning og meget andet godt - méthode à la O'Reilly

Sunday, February 8, 2009

Print-on-demand og self publishing i ytringsfrihedens tjeneste

Frederik Stjernfelt skriver i seneste nr. af Weekendavisen om tegnserien Jesus and Mo, der nok kan gøre en og anden Muhammedtegningforskrækket ekstremist ude af sig selv. Læs selv Stjernfelts artikel her. Nu er det så heldigt, at seriens skaber udgiver en stribe hver dag på nettet. Og én gang om året udgiver han "årets striber" på www.lulu.com, som print-on-demand ("POD"). På den måde har evt. vrede ekstremister hverken mulighed for at lade deres vrede gå ud over forlaget (for der er ingen forlægger) eller forfatteren, som har valgt at være anonym.

Langt de fleste forfattere der udgiver bøger på Lulu.com, er dog ikke anonyme. De benytter sig blot af den foreliggende mulighed for at få udgivet deres bøger. Lulu.com er en såkaldt self publishing-service, hvor en forfatter kan oploade sit færdigredigerede manuskript, som kunder så kan bestille. Først derefter bliver bogen trykt, indbundet og sendt. Der er intet lager og der kan produceres helt ned til ét eksemplar ad gangen.Oven i købet stiller Lulu.com også værktøjer til markedsføring af bøgerne - og vejledning i samme - til rådighed for forfatterne

Bob Young, som er grundlægger af Lulu.com, deltager i en paneldiskussion om "forlagenes nye rolle" ved Tools of Change for Publishing-konferencen i New York. Både Print-on-demand og self publishing er fænomener, der er ved at bide sig fast i den amerikanske forlagsbranche.

Jeg er tilmeldt konferencen og glæder mig til at høre mere om dette og om erfaringer og planer med de mange andre nye muligheder og udfordringer, fra forlag, hvor digitaliseringen for alvor har banket på.

Friday, February 6, 2009

Bøger kan læses online på din mobil

Nu skal man kunne læse alle de gratis tilgængelige bøger,der findes i Google Booksearch, på sin mobil (hvis man har en iPhone eller en telefon med Android-platform). De gratis bøger er for størstedelens vedkommende "out of copyright"-bøgerne. Det er onlinelæsning, så der er ingen download- eller DRM-problematik. At indholdet i Google Book Search er søgbart er i forvejen en stor styrke.

Man kan selv læse om det på O'Reilly's Tools of Change for Publishing-blog:

I forvejen går det tilsyneladende forrygende med ebogslæserapplikationen "Stanza" til iPhone, som allerede er en af de mest brugte måder at læse sine (downloadede) ebøger på. Når man bruger sin mobiltelefon som ebogslæser, behøver man ikke et særligt læseapparat i form af en Kindle eller en Sony e-reader.

Tuesday, January 16, 2007

XML schema design for document authoring

By: Marie Bilde Rasmussen, 2006

This posting is a copy of my contribution to the poster session at the ExtremeMarkup conference 2006 in Montreal

David Birnbaum (University of Pittsburgh) wrote on his conference blog: You want your students and clients to read the intelligent and lucid two pages of Marie Bilde Rasmussen’s “XML Schema Design for Document Authoring,” which provide clear, concise, and practical guidelines to useful, learnable, teachable, and maintainable design. If there were an award for the best overall poster of the conference, this would be the winner.

C. Michael Sperberg-McQueen (W3C) said in his closing remarks at the conference: I was very struck with something that Maria Bilde Rasmussen said in connection with her poster, about author-centered XML. The goal for an editing system for lexicographers is that when a lexicographer looks at the screen he should not say, “Oh, okay: this is an XML document that represents a lexicographic entry.” You want the lexicographer to look at the screen and say: “This is a lexicographic entry.” Period. If absolutely necessary it may be ok if they say, “This a lexicographic entry represented in XML” - but not “This is primarily an XML document.” You want them to see through the XML, to the information.

XML schema design for document authoring
using XML to support the process

Document authoring is sometimes the predominant time consuming factor in the production cyclus. XML schemas tend to be designed only to describe the final state of data, representing a structure that allows later data processing, but is not further customized to support the authoring process.

The schema should inform the author about exactly which elements (etc.) are relevant to insert/use in a given structural context. The grammar will appear much simpler from a local point of view. And the author will be able to recognize the information types of the current text type. However, we cannot assume that he is an expert on XML or markup in general

This schema use will probably require a more complex set of rules. But schema complexity and the resulting extra ressources spent on schema design is a good investment if the time spent on authoring is reduced and the data quality is increased. So, instead of only defining XML vocabularies as being either document or data oriented, it might be a good idea to focus on the authoring process when designing the XML-environment for (the authoring of) a given text type.

Taking the authoring process into account affects:

schema design
selection of relevant schema language(s)
selection of an appropriate application

Assuming that the author uses an application that is schema aware (e.g. by exploiting the PSVI of a W3C schema intensively) the schema can be designed to facilitate the authoring task. If the application furthermore provides means of data presentation in the editing view, we can actually support and help authors to concentrate on their primary task: text production

definitions

document authoring is simoultaneous content production, editing and markup, performed by an author
an author is a person producing a piece of text
an application is a piece of software used for authoring

schema design goals

the vocabulary and the relations defined by the schema must be recognized by the author as a meaningful representation of the text type and the chosen analysis model
in any given structural context, the schema must allow the insertion/deletion/alteration of exactly the relevant elements/tree fragments as siblings or children
the author should recognize working with the XML environment as more beneficial than working without it. He should not feel reduced to some sort of technical encoder
the schema is the author's working tool, and the perfect tool excels by being inconspicuous (the schema language is the designer's tool). This means that if the schema is well-designed, the author does not pay any attention to -- and is not distracted by -- the xml'ness: he can focus on his text

schema design strategies

structures should be shallow in order to keep as much of the text on the screen at the same time and to prevent the text from being abruptly fragmented
depth should be dynamic and only be used when necessary (structures should not always be as deep as in the worst case)
bottom-up markup must be possible, i.e. that coherent pieces of text can first be written and thereafter marked up
there should be a high degree of context sensitivity in the sense that only relevant and all the relevant substructures are valid in a given context (in a W3C xsd this may result in a very large variety of global types in a Venetian blind or Garden of Eden approach)
element and attribute naming should be meaningful and take the distinction between content, form and function into account
mixed content should only be used in coherent "textual" contexts

Saturday, January 6, 2007

document-oriented XML vs. data-oriented XML: an awkward distinction

Whether you use the term document-oriented XML or narrative XML documents and define this phenomenon to be the opposite of something called data-oriented XML or record-oriented XML, it is assumed that the markup’s structure (or at least: the very nature of the data structure) emerges from the text type in it’s own right, i.e. regardless of it’s interaction with the surrounding world.

It is also assumed, that very complex and less ordered data are more likely to having been produced manually, whereas very simple, repetitive and maybe quite linear data are considered as the typical expression of computer-produced XML. Rigidly maintaining this distinction and these assumptions makes life difficult for some XML content architects.

The variety of text types is far more complicated than this. Lexicographers author texts that are VERY complex yet very well-ordered and carefully restricted structures. Other texts' structure may be very simple and repetitive, even though it is very difficult to analyse the content correctly in order to mark it up, and therefore the markup process is performed by human authors. Maybe other texts again could quite poorly structured, e.g. with plenty of mixed content, but despite this, it is being marked-up by computers.

In my view there are a number of parameters that must be taken into account if one wishes to seize the most adequate design of a data structure for some 'text':

The text type itself. Are we dealing with
- a medieval poem
- a result of a database query
- a scientific report
- an entry in a phonebook/a dictionary/an encyklopedia
- technical documentation
- ...

The content production process. Is the content
- output from a computer process?
- manually keyed in?
- already there?
- added here and there to an existing text?, e.g. as part of a revising process

The markup process. Is the markup process
- carried out manually?
- handled by a computer process?
- simultaneous with the writing of the text - perhaps even integrated with it?
- applied to a preexisting text?
- consisting of some structural rearrangement/transformation/extension of an already existing structure?

The intended use of the marked-up text. Shall the text
- only be published? (in print or electronically)
- be read in a structured format?
- be searchable by categories?
- be subject to research and comparison with other similar texts?
- be exchanged and read by automated processes?

Possibly we will add to this list of perspectives in order to decide wich design strategy to follow in a given project invlving xml authoring. But already at this point, it should be clear, that it is not only the nature of the data, that has to be considered during a schema design process. Authoring processes, the text type and the very purpose of marking up the text must not be ignored. In this light, the discrimination between document and data oriented xml appears at best to be insufficient